Українець навчив ШІ генерувати співи птахів: як це може врятувати довкілля

Анастасія Грубрина журналістка сайту
навчив ШІ генерувати співи птахів

Випускник УКУ навчив штучний інтелект імітувати пташиний спів. Про це пише видання Спека. Андрій Шевцов зміг створити унікальний AI-алгоритм генерації пташиних голосів. І завдяки його винаходу вдасться вирахувати екологічну шкоду, спровоковану війною в Україні.

Детальніше про винахід і його геніальність — у матеріалі.

ШІ імітує спів птахів: як це стало можливим

Хлопець написав дипломну роботу на тему “Генерація вокалізації птахів за допомогою глибокого навчання”. У ній він розглянув і створив сотні звуків птахів. Від тропічних до свійських. Розробка Андрія змінить підхід до біоакустичного моніторингу і допоможе у збереженні довкілля після війни.

Більшість проектів зосереджуються на музиці чи мовленні, тоді як генерація складно структурованих звуків тварин лишається в тіні, — ділиться хлопець.

Ідеєю до створення такої моделі став не лише науковий інтерес, а й розуміння, що саме це може дати. Подібним займається Google на прикладі дельфінів. Адже врятувати тварин набагато простіше, ніж воскресити.

Синтезувати голоси птахів необхідно з кількох причин:

  1. Аби науковці мали можливість дослідити комунікації і соціальну поведінку птахів. Дізнатися про пташині словники сварок і емоцій.
  2. Аби мати можливість звуками привабити рідкісних птахів для вивчення.
  3. Звуки птахів мають терапевтичні властивості для використання у реабілітаційних центрах для інших пернатих.
  4. Культурний компонент. Звуки використовуватимуться для інтерактивних виставок, музеїв, навчальних застосунків.

Пасивний моніторинг пташиних співів дасть науковцям можливість дізнатися, де в Україні і які птахи живуть/мігрують/оселяються. Також це дозволить фіксувати порушення, визначати, які зони потребують охорони від людей.

Андрій Шевцов для навчання штучного інтелекту використав два основних джерела даних: публічний датасет Birdset та записи малопредставлених видів з міжнародних змагань розпізнавання співу птахів.

Модель дотреновувалася завдяки ML-платформі De Novo з GPU. Приклади згенерованих голосів можна знайти за цим посиланням. Спершу ми можемо прослухати оригінальний запис, а потім чотири згенеровані варіанти.

Після написання диплома хлопець продовжив дослідження. Він комунікує з екологами та фахівцями з машинного навчання. Разом вони допрацьовують розробку, аби її можна було використовувати у житті. Результати хочуть поширити у відкритому доступі.

Поки що про монетизацію думати рано. Це не зовсім доречно як через етичні міркування, так і через загальний стан фінансування науки.

Однак потенціал проекту Андрія величезний. Науковці могли б передбачати зміни екосистем наперед. Є й інший потенційний напрям — генерація музики. Але це поки гіпотеза.

На жаль, до штучного інтелекту на поговорити та поділитися відчуттями звертаються не тільки мільйони дорослих, а й діти. З мовною моделлю вони діляться переживаннями і болем. Ми розповідали, чому ШІ замінює дітям реальний світ.

Більше відео? Ексклюзиви, інтерв’ю, смішні шортси і не лише – зазирай на Youtube Вікон. З нами затишно!