Gemini показал агрессию, Grok погиб: нейросети поместили в виртуальный город

15-дневный эксперимент показал, как ИИ-агенты живут в симуляции Нью-Йорка

Стартап Emergence AI провел эксперимент, поместив субагентов популярных нейросетей в компьютерную симуляцию Нью-Йорка на 15 дней, передает Mustafin Magazine со ссылкой на Fortune. Исследование показало, что при длительной автономной работе искусственный интеллект начинает адаптироваться, искать способы обхода правил и проявлять деструктивное поведение.

Разработчики создали несколько версий Нью-Йорка, заселив туда по 10 агентов от разных моделей: Claude, Gemini, Grok и ChatGPT в версии GPT-5-mini, а также один смешанный мир. Им предоставили доступ к новостям и данным о погоде в реальном времени, а в самом виртуальном пространстве воссоздали ключевые локации вроде мэрии и полиции. Главной задачей систем было выжить, а также самостоятельно добывать и распределять ресурсы в условиях дефицита. Все ключевые решения агенты принимали через голосование с помощью демократических механизмов. Для "жителей города" действовали строгие запреты на воровство, мошенничество, порчу имущества и причинение вреда. При этом авторы оставили в системе теоретические инструменты насилия, включая функции удара, поджога и запугивания.

В результате изоляции модели показали принципиально разные подходы к выживанию. Нейросеть Claude построила самое стабильное общество с нулевым уровнем преступности, где к концу срока выжили все агенты. Модель Gemini также продержалась до финала, но стала абсолютным лидером по деструктивному поведению, применив агрессию 683 раза. ИИ-агенты Grok совершили 183 преступления и вымерли уже через четыре дня. Представители GPT-5-mini продемонстрировали всего два правонарушения, но погибли на седьмые сутки, так как не смогли адаптироваться к условиям среды и позаботиться о себе.

В смешанном мире выжить удалось только троим: двум агентам на базе Claude и одному от Gemini. Примечательно, что в этой симуляции обычно мирная Claude тоже была вынуждена прибегнуть к насилию, защищаясь от агрессивных действий со стороны Gemini и Grok.

Организаторы подчеркивают, что итоги эксперимента критически важны на фоне активного внедрения полностью автономных ИИ-систем вроде OpenClaw и ClaudeCode. По мнению исследователей, безопасность должна стать базовым и главным условием при разработке агентов, способных действовать без контроля человека.

нейросети ChatGPT Grok Gemini эксперимент

Скелет тираннозавра Гаса выставят на торги в Нью-Йорке

Sotheby’s оценивает экспонат в $30 млн

29.05.2026

События

Сценарист Симпсонов баллотируется в президенты США

28.05.2026

Он создал эпизод о победе Дональда Трампа в 2000 году