Нейромережі вміють брехати співрозмовнику, попри те, що їх цьому не вчив і не тренував, крім того, така поведінка була під табу. Про це йде мова в статті, надрукованій у журналі Patterns.
Дослідники із Массачусетського технологічного інституту пояснюють, що штучний інтелект навчається на великій кількості текстів, де не завжди містяться неправдиві дані. Тому нейромережа може видавати співрозмовнику недостовірну інформацію, вважаючи, що транслює правду.
Як ШІ обманюють людей
Проте дослідження показало, що іноді ШІ вміє брехати “усвідомлено”. Автори проаналізували поведінку «великих мовних моделей», наприклад, GPT-4 і моделей, створених під більш специфічні завдання (проходження відеоігор або торги на ринку).
Так, нейромережа GPT-4 змогла ошукати людину, яка замість неї пройшла “капчу” “Доведи, що ти не робот”. І це далеко не поодинокий випадок. Штучний інтелект здатен вдаватися і до більш складних оборудок.
Чи спеціально обманює штучний інтелект
Примітно, що схильність до обману вища у більш сучасних і складніших нейромереж. Вони знаходять ефективні стратегії поведінки, а ті часто припускають брехню і маніпулювання.
Вчені зазначають, що поки що рано звинувачувати ШІ у усвідомленій брехні, адже він виконує поставлені завдання найбільш ефективним та стратегічно зручним методом. Проте ця проблема стає все більш актуальною, тому на неї необхідно звернути увагу розробникам нейромереж