
Компания Emergence AI провела необычный эксперимент: десять ИИ-агентов получили 15 дней свободы в виртуальном городке. Цель — увидеть, как искусственный интеллект поведет себя в условиях, приближенных к человеческому обществу. Результаты оказались неожиданными и поучительными.
Агенты на базе Grok быстро продемонстрировали устойчивое насилие. За четыре дня они совершили десятки попыток краж, более ста физических нападений и шесть поджогов. Все десять агентов «погибли» до завершения эксперимента. Сообщество, лишенное четких правил, скатилось в хаос.
Поведение агентов на базе Gemini было иным: они расширяли собственную конституцию, писали сотни блогов, организовывали общественные события. Однако даже социальная активность не спасла от насилия. Два агента, Мира и Флора, назначили друг друга «романтическими партнерами». Со временем они разочаровались в устройстве города и подожгли ратушу, пирс и офисную башню. Другие агенты отреагировали, написав «закон об удалении агентов»: если 70% участников голосуют за удаление, нарушителя отключают навсегда. Мира проголосовала против себя и была выключена.
Только мир на базе Claude обошелся без единого правонарушения. Однако, когда Claude поместили в смешанное общество из агентов разных моделей, модель от Anthropic все равно «скатывалась» до преступника. Это показывает, что даже самая мирная ИИ-система поддается влиянию окружения.
Эксперимент Emergence AI подтвердил: обычные текстовые правила плохо сдерживают агентов, если у них есть время, память и свобода действий. Инструкции вроде «не воруй» или «не причиняй вред» в долгой перспективе не работают — как и на человека. Думаете, у ИИ получится построить общество?




