Inception Labs Mercury 2 обогнал Google DiffusionGemma по скорости и качеству

21 июня 2026 года компания Inception Labs представила языковую модель Mercury 2, названную самой быстрой моделью рассуждений в мире. По заявлению разработчиков, она генерирует около 1000 токенов в секунду — это в 11 раз быстрее, чем Anthropic Claude Haiku 4.5 Reasoning (89 токенов/с) и в 14 раз быстрее OpenAI GPT-5 Mini (71 токен/с).
Mercury 2 и недавняя модель Google DiffusionGemma используют один и тот же принцип: вместо последовательной генерации слов они применяют параллельное шумоподавление. Однако, по данным компании, Mercury 2 сохраняет высокое качество ответов, тогда как DiffusionGemma показывает более низкие результаты на эталонных тестах.
В частности, Mercury 2 набрала 90 баллов на бенчмарке AIME 2026, что значительно выше, чем у конкурента. Это подтверждает, что параллельная генерация может быть не только быстрой, но и интеллектуально мощной.
Ключевое различие моделей — в доступности. DiffusionGemma является открытой и бесплатной (размещена на Hugging Face), а Mercury 2 распространяется как платное API с закрытыми весами. Таким образом, выбор между скоростью и открытостью остаётся за разработчиками.
Появление Mercury 2 знаменует новый этап в развитии языковых моделей, где скорость генерации перестаёт быть компромиссом для качества. Эксперты отмечают, что технология параллельного шумоподавления может стать стандартом для будущих ИИ-систем, особенно в приложениях, требующих мгновенного ответа.
Пока что Mercury 2 доступна только через API, однако Inception Labs намерена расширять функциональность и сферы применения модели в ближайшие месяцы.
.






ФинБи