Anthropic запускает Claude Mythos: модель для кибервзломов вызывает тревогу

Компания Anthropic сообщила, что ожидает расширения доступа к своей ИИ-модели Claude Mythos «в ближайшие недели». Это указывает на возможный выход модели за пределы строго ограниченного тестирования, которое проводилось в рамках программы Project Glasswing.
Claude Mythos привлекла внимание исследователей, которые обнаружили, что модель способна автономно выявлять уязвимости и выполнять сложные кибератаки. Эти возможности вызвали серьезные опасения в сообществе кибербезопасности.
В Anthropic подчеркнули, что продолжают работу над механизмами защиты и тестированием, прежде чем предоставить более широкий доступ. Компания отмечает, что стремится к «быстрому прогрессу» в разработке безопасных методов использования модели.
На данный момент Claude Mythos доступна лишь ограниченному кругу участников Project Glasswing. Представители Anthropic не уточнили, какие именно категории пользователей получат доступ к модели после расширения.
Новость о скором запуске появилась на фоне роста дискуссий о потенциальных рисках мощных ИИ-систем. Эксперты предупреждают, что Claude Mythos может быть использована для автоматизации кибератак на критически важную инфраструктуру.
Anthropic, основанная бывшими сотрудниками OpenAI, позиционирует себя как компанию, ориентированную на безопасный ИИ. Однако выпуск такой модели ставит вопрос о балансе между инновациями и потенциальными угрозами.
.






ФинБи