Падение баллов Claude Fable 5 оказалось сбоем маршрутизатора — модель не «урезали»

Редакция Finbi 04-июл, 00:32 Криптовалюта 1 Биткоин

После возобновления работы Claude Fable 5 от Anthropic 1 июля в соцсетях появились жалобы — модель якобы стала хуже, «урезали» или «лоботомировали». Однако, как пишет Decrypt со ссылкой на бенчмарки, реальная причина кроется в работе классификатора безопасности.

Бенчмарк BridgeBench показал падение показателя отладки с 86,2 до 25,9. Но это падение, по данным источника, связано с тем, что маршрутизатор безопасности начал направлять большинство задач на более слабую модель Opus 4.8, а не с ухудшением самой Fable 5.

В то же время слепые тесты Arena.AI, где тысячи голосов сравнивали результаты разных версий модели, продемонстрировали примерно равную производительность — в некоторых категориях (работа с документами, экспертные тексты) показатели даже немного выросли.

В Anthropic подтвердили, что новые классификаторы могут давать ложные срабатывания на рутинных задачах кодирования и отладки. Компания пообещала доработать систему, но не назвала точных сроков.

Таким образом, падение баллов связано не с изменением самой модели, а с избыточной осторожностью маршрутизатора. Для пользователей это означает, что качество ответов Fable 5 осталось прежним, но часть запросов может перенаправляться на другую модель из-за ошибок классификатора.

Падение баллов Claude Fable 5 оказалось сбоем маршрутизатора — модель не «урезали»

Разделы

Навигация

Теги

Падение баллов Claude Fable 5 оказалось сбоем маршрутизатора — модель не «урезали»

Читайте также

Разделы

Навигация

Теги