Nvidia представила фреймворк ENPIRE: роботы обучаются без людей с помощью ИИ-агентов

Nvidia представила фреймворк ENPIRE: роботы обучаются без людей с помощью ИИ-агентов

Nvidia, Университет Карнеги-Меллон и Калифорнийский университет в Беркли представили фреймворк ENPIRE, который позволяет ИИ-агентам полностью автоматизировать обучение роботов. Агенты, работающие на базе моделей Codex, Claude Code и Kimi Code, самостоятельно пишут код для тренировки, проводят тесты на реальном оборудовании и вносят улучшения — без какого-либо вмешательства человека.

В лаборатории GEAR компании Nvidia флот из восьми роботизированных манипуляторов в течение нескольких недель учился выполнять три задачи: вставку штифтов, установку графических процессоров и резку кабельных стяжек. По данным разработчиков, итоговый показатель успешности выполнения этих операций достиг 99%.

Масштабирование системы с одного робота до восьми позволило сократить время, необходимое для освоения каждой задачи, более чем вдвое. Однако при этом затраты на использование токенов (вычислительные ресурсы) росли быстрее, чем экономия времени. Тем не менее, отсутствие необходимости в постоянном контроле со стороны человека делает такой подход крайне перспективным для промышленности.

ENPIRE (от англ. ENvironment for Purely Independent Robot Education) представляет собой среду, в которой ИИ-агенты могут взаимодействовать с симуляциями и реальными роботами. Агент получает задание, генерирует код для обучения с подкреплением, запускает его на симуляторе, а затем переносит на реальные роботы. Если успешность ниже порога, агент анализирует ошибки и корректирует код.

В тестах участвовали три ИИ-агента: Codex от OpenAI, Claude Code от Anthropic и Kimi Code от Moonshot AI. Каждый из них показал способность самостоятельно разрабатывать стратегии обучения, причём Codex и Claude Code продемонстрировали наилучшие результаты. По словам исследователей, ENPIRE может стать основой для создания полностью автономных роботизированных производственных линий.

Хотя текущая версия ENPIRE сосредоточена на сравнительно простых задачах, авторы проекта видят потенциал для применения в более сложных сценариях — от сборки электроники до медицинских операций. Дальнейшее развитие может быть связано с удешевлением вычислительных ресурсов и оптимизацией алгоритмов, что сделает автономное обучение роботов более доступным.

Представленная технология открывает путь к созданию роботов, которые могут самостоятельно осваивать новые навыки без дорогостоящего и длительного программирования. Это особенно актуально для гибких производств, где требуется быстрая переналадка оборудования под выпуск новой продукции.