Inception Labs Mercury 2 обогнал Google DiffusionGemma по скорости и качеству

Редакция Finbi 21-июн, 20:11 Криптовалюта 1 Биткоин

21 июня 2026 года компания Inception Labs представила языковую модель Mercury 2, названную самой быстрой моделью рассуждений в мире. По заявлению разработчиков, она генерирует около 1000 токенов в секунду — это в 11 раз быстрее, чем Anthropic Claude Haiku 4.5 Reasoning (89 токенов/с) и в 14 раз быстрее OpenAI GPT-5 Mini (71 токен/с).

Mercury 2 и недавняя модель Google DiffusionGemma используют один и тот же принцип: вместо последовательной генерации слов они применяют параллельное шумоподавление. Однако, по данным компании, Mercury 2 сохраняет высокое качество ответов, тогда как DiffusionGemma показывает более низкие результаты на эталонных тестах.

В частности, Mercury 2 набрала 90 баллов на бенчмарке AIME 2026, что значительно выше, чем у конкурента. Это подтверждает, что параллельная генерация может быть не только быстрой, но и интеллектуально мощной.

Ключевое различие моделей — в доступности. DiffusionGemma является открытой и бесплатной (размещена на Hugging Face), а Mercury 2 распространяется как платное API с закрытыми весами. Таким образом, выбор между скоростью и открытостью остаётся за разработчиками.

Появление Mercury 2 знаменует новый этап в развитии языковых моделей, где скорость генерации перестаёт быть компромиссом для качества. Эксперты отмечают, что технология параллельного шумоподавления может стать стандартом для будущих ИИ-систем, особенно в приложениях, требующих мгновенного ответа.

Пока что Mercury 2 доступна только через API, однако Inception Labs намерена расширять функциональность и сферы применения модели в ближайшие месяцы.

Inception Labs Mercury 2 обогнал Google DiffusionGemma по скорости и качеству

Разделы

Навигация

Теги

Inception Labs Mercury 2 обогнал Google DiffusionGemma по скорости и качеству

Читайте также

Разделы

Навигация

Теги