Украинец научил ИИ генерировать пение птиц: как это может спасти окружающую среду

Анастасия Грубрина журналист сайта
научил ИИ генерировать пение птиц

Выпускник УКУ научил искусственный интеллект имитировать пение птиц. Об этом пишет издание Спека. Андрей Шевцов смог создать уникальный AI-алгоритм генерации птичьих голосов. И благодаря его изобретению удастся вычислить экологический ущерб, спровоцированный войной в Украине.

Детальнее об изобретении и его гениальности — в материале.

ИИ имитирует пение птиц: как это стало возможным

Парень написал дипломную работу по теме “Генерация вокализации птиц с помощью глубокого обучения”. В ней он рассмотрел и создал сотни звуков птиц. От тропических до домашних. Разработка Андрея изменит подход к биоакустическому мониторингу и поможет сохранить окружающую среду после войны.

Большинство проектов сосредотачиваются на музыке или в речи, тогда как генерация сложно структурированных звуков животных остается в тени, — делится парень.

Идеей создания такой модели стал не только научный интерес, но и понимание, что именно это может дать. Подобным занимается Google на примере дельфинов. Ведь спасти животных гораздо проще, чем воскресить.

Синтезировать голоса птиц необходимо по нескольким причинам:

  1. Чтобы ученые имели возможность изучить коммуникации и социальное поведение птиц. Узнать о птичьих словарях ссор и эмоций.
  2. Чтобы иметь возможность привлечь звуками редких птиц для изучения.
  3. Звуки птиц обладают терапевтическими свойствами для использования в реабилитационных центрах других пернатых.
  4. Культурный компонент. Звуки будут использоваться для интерактивных выставок, музеев, учебных приложений.

Пассивный мониторинг птичьего пения позволит ученым узнать, где в Украине и какие птицы живут/мигрируют/поселяются. Также это позволит фиксировать нарушения, определять, какие зоны нуждаются в охране от людей.

Андрей Шевцов для обучения искусственного интеллекта использовал два основных источника данных: публичный датасет Birdset и записи малопредставленных видов с международных соревнований по распознаванию пения птиц.

Модель дотренировалась благодаря ML-платформе De Novo из GPU. Примеры сгенерированных голосов можно найти по этой ссылке. Сначала мы можем прослушать оригинальную запись, а затем четыре сгенерированных варианта.

После написания диплома парень продолжил исследование. Он общается с экологами и специалистами по машинному обучению. Вместе они заканчивают разработку, чтобы ее можно было использовать в жизни. Результаты хотят распространить в открытом доступе.

Пока что о монетизации думать рано. Это не совсем уместно как по этическим соображениям, так и по общему состоянию финансирования науки.

Однако потенциал проекта Андрея огромен. Ученые могли бы предусматривать изменения экосистем наперед. Есть и другое потенциальное направление генерация музыки. Но это пока что гипотеза.

К сожалению, к искусственному интеллекту на поговорить и поделиться чувствами обращаются не только миллионы взрослых, но и дети. С речевой моделью они делятся переживаниями и болью. Мы рассказывали, почему ИИ заменяет детям реальный мир.

Больше видео? Не вопрос! Эксклюзивы, интервью, смешные Shorts и не только – скорее на Youtube Вікон. Твой уютный канал!