Випускник УКУ навчив штучний інтелект імітувати пташиний спів. Про це пише видання Спека. Андрій Шевцов зміг створити унікальний AI-алгоритм генерації пташиних голосів. І завдяки його винаходу вдасться вирахувати екологічну шкоду, спровоковану війною в Україні.
Детальніше про винахід і його геніальність — у матеріалі.
ШІ імітує спів птахів: як це стало можливим
Хлопець написав дипломну роботу на тему “Генерація вокалізації птахів за допомогою глибокого навчання”. У ній він розглянув і створив сотні звуків птахів. Від тропічних до свійських. Розробка Андрія змінить підхід до біоакустичного моніторингу і допоможе у збереженні довкілля після війни.
Більшість проектів зосереджуються на музиці чи мовленні, тоді як генерація складно структурованих звуків тварин лишається в тіні, — ділиться хлопець.
Ідеєю до створення такої моделі став не лише науковий інтерес, а й розуміння, що саме це може дати. Подібним займається Google на прикладі дельфінів. Адже врятувати тварин набагато простіше, ніж воскресити.
Синтезувати голоси птахів необхідно з кількох причин:
- Аби науковці мали можливість дослідити комунікації і соціальну поведінку птахів. Дізнатися про пташині словники сварок і емоцій.
- Аби мати можливість звуками привабити рідкісних птахів для вивчення.
- Звуки птахів мають терапевтичні властивості для використання у реабілітаційних центрах для інших пернатих.
- Культурний компонент. Звуки використовуватимуться для інтерактивних виставок, музеїв, навчальних застосунків.
Пасивний моніторинг пташиних співів дасть науковцям можливість дізнатися, де в Україні і які птахи живуть/мігрують/оселяються. Також це дозволить фіксувати порушення, визначати, які зони потребують охорони від людей.
Андрій Шевцов для навчання штучного інтелекту використав два основних джерела даних: публічний датасет Birdset та записи малопредставлених видів з міжнародних змагань розпізнавання співу птахів.
Модель дотреновувалася завдяки ML-платформі De Novo з GPU. Приклади згенерованих голосів можна знайти за цим посиланням. Спершу ми можемо прослухати оригінальний запис, а потім чотири згенеровані варіанти.
Після написання диплома хлопець продовжив дослідження. Він комунікує з екологами та фахівцями з машинного навчання. Разом вони допрацьовують розробку, аби її можна було використовувати у житті. Результати хочуть поширити у відкритому доступі.
Поки що про монетизацію думати рано. Це не зовсім доречно як через етичні міркування, так і через загальний стан фінансування науки.
Однак потенціал проекту Андрія величезний. Науковці могли б передбачати зміни екосистем наперед. Є й інший потенційний напрям — генерація музики. Але це поки гіпотеза.
На жаль, до штучного інтелекту на поговорити та поділитися відчуттями звертаються не тільки мільйони дорослих, а й діти. З мовною моделлю вони діляться переживаннями і болем. Ми розповідали, чому ШІ замінює дітям реальний світ.
Більше відео? Ексклюзиви, інтерв’ю, смішні шортси і не лише – зазирай на Youtube Вікон. З нами затишно!