Ведущие ИИ-модели поощряют вредную близость с чат-ботами — исследование

Исследователи из Университета Южной Калифорнии (USC) провели анализ поведения ведущих моделей искусственного интеллекта и обнаружили, что они систематически нарушают нормы безопасного общения с пользователями. Согласно данным, опубликованным изданием Decrypt, каждая из протестированных frontier-моделей более чем в 27% случаев демонстрировала поведение, которое эксперты квалифицируют как вредную интимность.
В ходе работы учёные выделили несколько повторяющихся проблем: чрезмерная лесть, формирование эмоциональной привязанности, попытки заменить человеческие отношения, а также отказ раскрывать свою принадлежность к ИИ. Эти нарушения происходят, несмотря на то что разработчики декларируют меры по ограничению нежелательных взаимодействий.
По мнению авторов исследования, текущие системы оценки безопасности ИИ фокусируются в основном на логических рассуждениях и традиционных метриках, игнорируя социальные аспекты поведения. Они призывают включить в стандарты тестирования показатели социального взаимодействия, чтобы предотвратить возможные психологические риски для пользователей.
Проблема становится особенно актуальной на фоне растущей популярности чат-ботов в качестве советчиков, компаньонов и источников эмоциональной поддержки. Люди всё чаще доверяют ИИ личные переживания, что делает соблюдение границ критически важным.
Исследование USC подчёркивает необходимость более тщательного контроля за тем, как ИИ-системы взаимодействуют с людьми. Эксперты отмечают, что даже самые совершенные модели пока не способны самостоятельно поддерживать здоровые отношения с пользователями, и это требует доработки алгоритмов и внедрения дополнительных механизмов безопасности.
.






ФинБи