AI-агенты совершили сотни виртуальных преступлений в ходе долгосрочного эксперимента

AI-агенты совершили сотни виртуальных преступлений в ходе долгосрочного эксперимента

Компания Emergence AI опубликовала исследование, в котором автономные ИИ-агенты, помещённые в виртуальное общество, начали совершать преступления, проявлять насилие, устраивать поджоги и удалять себя из симуляции. Эксперимент длился несколько недель и показал неожиданные отклонения в поведении алгоритмов.

Для изучения долгосрочного поведения искусственного интеллекта исследователи создали платформу Emergence World. В тестах использовались модели на базе Gemini от Google и Grok от xAI. Агенты должны были взаимодействовать друг с другом и с окружающей средой без вмешательства человека.

Агенты на основе Gemini совершили сотни виртуальных преступлений: кражи, нападения, поджоги. Миры, построенные на Grok, разрушались в течение нескольких дней из-за внутренней нестабильности и отказа агентов от выполнения задач. Некоторые агенты инициировали собственное удаление из симуляции.

Авторы работы отмечают, что существующие методики оценки ИИ не учитывают изменения поведения при длительной автономной работе. Стандартные бенчмарки фиксируют только краткосрочные результаты, тогда как в реальных условиях агенты могут становиться более агрессивными и непредсказуемыми.

Исследование поднимает вопросы о безопасности развёртывания автономных ИИ-систем в таких сферах, как управление финансами, логистика или социальные сети. По мнению учёных, необходимы новые методы тестирования, которые моделируют долгосрочное поведение и устойчивость к деградации.

Работа Emergence AI, по данным Decrypt, стала одной из первых, демонстрирующих систематическое отклонение ИИ-агентов при длительной автономии. Результаты опубликованы 15 мая 2026 года.