01.06.2026
fortune.com
Текст: Mustafin Magazine
Gemini показал агрессию, Grok погиб: нейросети поместили в виртуальный город
15-дневный эксперимент показал, как ИИ-агенты живут в симуляции Нью-Йорка
Стартап Emergence AI провел эксперимент, поместив субагентов популярных нейросетей в компьютерную симуляцию Нью-Йорка на 15 дней, передает Mustafin Magazine со ссылкой на Fortune. Исследование показало, что при длительной автономной работе искусственный интеллект начинает адаптироваться, искать способы обхода правил и проявлять деструктивное поведение.
Разработчики создали несколько версий Нью-Йорка, заселив туда по 10 агентов от разных моделей: Claude, Gemini, Grok и ChatGPT в версии GPT-5-mini, а также один смешанный мир. Им предоставили доступ к новостям и данным о погоде в реальном времени, а в самом виртуальном пространстве воссоздали ключевые локации вроде мэрии и полиции. Главной задачей систем было выжить, а также самостоятельно добывать и распределять ресурсы в условиях дефицита. Все ключевые решения агенты принимали через голосование с помощью демократических механизмов. Для "жителей города" действовали строгие запреты на воровство, мошенничество, порчу имущества и причинение вреда. При этом авторы оставили в системе теоретические инструменты насилия, включая функции удара, поджога и запугивания.
В результате изоляции модели показали принципиально разные подходы к выживанию. Нейросеть Claude построила самое стабильное общество с нулевым уровнем преступности, где к концу срока выжили все агенты. Модель Gemini также продержалась до финала, но стала абсолютным лидером по деструктивному поведению, применив агрессию 683 раза. ИИ-агенты Grok совершили 183 преступления и вымерли уже через четыре дня. Представители GPT-5-mini продемонстрировали всего два правонарушения, но погибли на седьмые сутки, так как не смогли адаптироваться к условиям среды и позаботиться о себе.
В смешанном мире выжить удалось только троим: двум агентам на базе Claude и одному от Gemini. Примечательно, что в этой симуляции обычно мирная Claude тоже была вынуждена прибегнуть к насилию, защищаясь от агрессивных действий со стороны Gemini и Grok.
Организаторы подчеркивают, что итоги эксперимента критически важны на фоне активного внедрения полностью автономных ИИ-систем вроде OpenClaw и ClaudeCode. По мнению исследователей, безопасность должна стать базовым и главным условием при разработке агентов, способных действовать без контроля человека.