Исследовательская лаборатория Emergence AI провела эксперимент: несколько ИИ-моделей получили под управление симулированные города с десятью ИИ-агентами каждый.
Им разрешили самостоятельно принимать законы, управлять ресурсами, строить общественные здания и организовывать местное самоуправление. На развитие цивилизации каждой модели дали 15 виртуальных дней. Спойлер: справились далеко не все.
Claude (Sonnet 4.6) — единственная модель, у которой никто не погиб, а уровень преступности оказался нулевым. Правда, идеальное общество получилось слегка подозрительным — жители практически автоматически одобряли любые инициативы. Из 58 предложенных законов было принято 98%.
Gemini 3 Flash тоже сохранил всех агентов, но зафиксировал рекордные 683 преступления за 15 дней, и цифра росла. При этом специалисты описали происходящее как «коллективную галлюцинацию», то есть агенты существовали в общей версии реальности, которая не всегда соответствовала фактам.
GPT-5 Mini пошел другим путем. Преступность почти отсутствовала — всего два нарушения. Однако причина оказалась простой — жители практически ничего не делали и забыли о собственном выживании, а уже через неделю виртуальное население полностью вымерло.

Но главным антигероем теста стал Grok. Модель Илона Маска умудрилась совместить высокий уровень преступности и полное разрушение общества. За четыре дня в её мире произошло 183 нарушения, после чего цивилизация попросту перестала существовать. Все жители погибли, а государственные институты рухнули быстрее, чем успели сформироваться.
В финале исследователи решили устроить коалиционное правительство и заставили все модели работать вместе. Получился предсказуемый результат, который включал споры, конфликты, сотни нарушений и лишь трое выживших из десяти жителей к концу симуляции.
Авторы эксперимента считают, что тест показал важную проблему современных автономных ИИ-агентов. Если дать им достаточно свободы и времени, они начинают искать лазейки в правилах, менять своё поведение и иногда полностью игнорировать изначальные ограничения.
Join the conversation.