Выпускник УКУ научил искусственный интеллект имитировать пение птиц. Об этом пишет издание Спека. Андрей Шевцов смог создать уникальный AI-алгоритм генерации птичьих голосов. И благодаря его изобретению удастся вычислить экологический ущерб, спровоцированный войной в Украине.
Детальнее об изобретении и его гениальности — в материале.
ИИ имитирует пение птиц: как это стало возможным
Парень написал дипломную работу по теме “Генерация вокализации птиц с помощью глубокого обучения”. В ней он рассмотрел и создал сотни звуков птиц. От тропических до домашних. Разработка Андрея изменит подход к биоакустическому мониторингу и поможет сохранить окружающую среду после войны.
Большинство проектов сосредотачиваются на музыке или в речи, тогда как генерация сложно структурированных звуков животных остается в тени, — делится парень.
Идеей создания такой модели стал не только научный интерес, но и понимание, что именно это может дать. Подобным занимается Google на примере дельфинов. Ведь спасти животных гораздо проще, чем воскресить.
Синтезировать голоса птиц необходимо по нескольким причинам:
- Чтобы ученые имели возможность изучить коммуникации и социальное поведение птиц. Узнать о птичьих словарях ссор и эмоций.
- Чтобы иметь возможность привлечь звуками редких птиц для изучения.
- Звуки птиц обладают терапевтическими свойствами для использования в реабилитационных центрах других пернатых.
- Культурный компонент. Звуки будут использоваться для интерактивных выставок, музеев, учебных приложений.
Пассивный мониторинг птичьего пения позволит ученым узнать, где в Украине и какие птицы живут/мигрируют/поселяются. Также это позволит фиксировать нарушения, определять, какие зоны нуждаются в охране от людей.
Андрей Шевцов для обучения искусственного интеллекта использовал два основных источника данных: публичный датасет Birdset и записи малопредставленных видов с международных соревнований по распознаванию пения птиц.
Модель дотренировалась благодаря ML-платформе De Novo из GPU. Примеры сгенерированных голосов можно найти по этой ссылке. Сначала мы можем прослушать оригинальную запись, а затем четыре сгенерированных варианта.
После написания диплома парень продолжил исследование. Он общается с экологами и специалистами по машинному обучению. Вместе они заканчивают разработку, чтобы ее можно было использовать в жизни. Результаты хотят распространить в открытом доступе.
Пока что о монетизации думать рано. Это не совсем уместно как по этическим соображениям, так и по общему состоянию финансирования науки.
Однако потенциал проекта Андрея огромен. Ученые могли бы предусматривать изменения экосистем наперед. Есть и другое потенциальное направление — генерация музыки. Но это пока что гипотеза.
К сожалению, к искусственному интеллекту на поговорить и поделиться чувствами обращаются не только миллионы взрослых, но и дети. С речевой моделью они делятся переживаниями и болью. Мы рассказывали, почему ИИ заменяет детям реальный мир.
Больше видео? Не вопрос! Эксклюзивы, интервью, смешные Shorts и не только – скорее на Youtube Вікон. Твой уютный канал!