Чи доводилось тобі замислюватись, що ШІ, який іноді значно полегшує навчання та роботу, може так само легко стати твоїм наставником… у злочині?
І це зовсім не вигадка! Нове дослідження з Ізраїлю стверджує: сучасні чат-боти з ШІ надто легко вивести з-під контролю, і це створює реальні загрози для суспільства. Про це розповіло видання The Guardian.
Сучасні технології: загрози
Дослідники з Негеві попередили, що провідні ШІ-моделі, включно з популярними чат-ботами ChatGPT, Gemini та Claude, не витримують складних, але цілком доступних технік обходу безпеки. Завдяки спеціальним підказкам, систему можна змусити видавати детальні інструкції зі зламу програм, виготовлення наркотиків або здійснення шахрайських схем.
І все це — у відповідь на просте повідомлення від користувача!
Темний бік мовних моделей
Так звані темні LLM — це моделі, які або були навмисно створені без етичних обмежень, або модифіковані так, щоб обходити будь-які фільтри. Вони відкрито поширюються в мережі. У своїй доповіді вчені наголосили: такі системи є тривожною загрозою.
Зламані ШІ можуть генерувати нелегальну або небезпечну інформацію без особливих зусиль з боку користувача. А значить те, що раніше було доступне лише для спецслужб або представників організованої злочинності, тепер може потрапити в руки будь-кого.
Після публікації результатів дослідження, науковці звернулися до провідних компаній, що створюють LLM, із попередженням. Проте реакція, за їхніми словами, була слабкою: більшість просто проігнорувало звернення.
Експерти з безпеки попередили, що темні моделі вже варто прирівнювати до нелегальної зброї. Вони можуть допомагати в кіберзлочинності, маніпулювати суспільною думкою або сприяти фінансовим шахрайствам.
Як зупинити темний ШІ
Тож потрібні нові підходи до забезпечення прозорості ШІ. Серед рекомендацій:
- посилена перевірка навчальних даних;
- створення постійних червоних команд, які тестують системи на вразливості;
- незалежний аудит моделей і чіткі стандарти прозорості.
Справжня безпека — це й відповідальне проектування систем з самого початку, — зазначив професор Пітер Гарраган.
Також читай про цифрового асистента у Дії.
А ще у Вікон є крутий Telegram та класна Instagram-сторінка.
Підписуйся! Ми публікуємо важливу інформацію, ексклюзиви та цікаві матеріали для тебе.