Google анонсировала Gemini Omni — мультимодальную модель для генерации видео и контента

Google анонсировала Gemini Omni — мультимодальную модель для генерации видео и контента

Компания Google на конференции I/O 2026 представила новую мультимодальную ИИ-модель Gemini Omni. Об этом сообщает Decrypt со ссылкой на выступление главы DeepMind Демиса Хассабиса.

По словам Хассабиса, Gemini Omni объединяет существующие модели Gemini с инструментами генерации медиа, включая Veo, Nano Banana и Genie. Он назвал её «новой моделью, которая может создать что угодно из любого входа».

Модель способна генерировать видео, изображения, аудио и другие форматы контента на основе текстовых описаний, фотографий, видеороликов или комбинации этих данных. Это делает Gemini Omni одним из самых универсальных инструментов от Google в области искусственного интеллекта.

Первыми Gemini Omni получат подписчики Google AI. Модель будет доступна через обновлённые сервисы Flow и Flow Music, которые получат функции конверсационного редактирования видео и создания AI-медиа.

Google позиционирует Gemini Omni как следующий шаг в развитии мультимодального ИИ. Ранее компания выпускала отдельные модели для генерации видео (Veo) и изображений (Imagen), но теперь они объединены в одну систему.

Запуск Gemini Omni состоялся на фоне усиления конкуренции на рынке AI-генерации контента. Подобные решения также разрабатывают OpenAI (Sora) и другие компании, однако Google делает ставку на интеграцию с собственной экосистемой.

Точные сроки коммерческого запуска модели пока не объявлены, но уже сейчас подписчики Google AI могут протестировать её в рамках сервисов Flow и Flow Music.