Claude Opus 4.8: улучшение математики и кода, но гигантский расход токенов

Claude Opus 4.8: улучшение математики и кода, но гигантский расход токенов

Компания Anthropic представила новую флагманскую модель Claude Opus 4.8 спустя шесть недель после предыдущей версии. Цены остались прежними — $5 за миллион входных токенов и $25 за миллион выходных, сообщает Decrypt.

Модель протестировали по шести категориям: творческое письмо, программирование, математика, логика, повествовательное рассуждение и работа с длинным контекстом. В математической задаче Opus 4.8 получила однозначную победу, а также создала самую чистую однопромптовую игру из всех когда-либо протестированных редакцией.

Однако при выполнении этого же задания на кодинг модель израсходовала всю квоту токенов Pro-плана одним запросом. Издание отмечает, что для масштабных проектов без Max-тарифа или значительных затрат через API использование модели становится непрактичным.

Творческое письмо практически не продвинулось вперёд по сравнению с Opus 4.7. Результаты тестов на логику и долгий контекст также не показали значительного отрыва.

В целом Anthropic усилила сильные стороны модели, но слабые места остались на прежнем уровне. Пользователям с ограниченным бюджетом стоит учитывать риск внезапного исчерпания лимитов при работе с новым флагманом.