Падение баллов Claude Fable 5 оказалось сбоем маршрутизатора — модель не «урезали»

После возобновления работы Claude Fable 5 от Anthropic 1 июля в соцсетях появились жалобы — модель якобы стала хуже, «урезали» или «лоботомировали». Однако, как пишет Decrypt со ссылкой на бенчмарки, реальная причина кроется в работе классификатора безопасности.
Бенчмарк BridgeBench показал падение показателя отладки с 86,2 до 25,9. Но это падение, по данным источника, связано с тем, что маршрутизатор безопасности начал направлять большинство задач на более слабую модель Opus 4.8, а не с ухудшением самой Fable 5.
В то же время слепые тесты Arena.AI, где тысячи голосов сравнивали результаты разных версий модели, продемонстрировали примерно равную производительность — в некоторых категориях (работа с документами, экспертные тексты) показатели даже немного выросли.
В Anthropic подтвердили, что новые классификаторы могут давать ложные срабатывания на рутинных задачах кодирования и отладки. Компания пообещала доработать систему, но не назвала точных сроков.
Таким образом, падение баллов связано не с изменением самой модели, а с избыточной осторожностью маршрутизатора. Для пользователей это означает, что качество ответов Fable 5 осталось прежним, но часть запросов может перенаправляться на другую модель из-за ошибок классификатора.
.






ФинБи