Hacker News · 03.07.2026 ·Исследования и наука

LLM перенимают социальные предубеждения в зависимости от присвоенных ролей

Исследование показало, что большие языковые модели склонны воспроизводить человеческие социальные иерархии и предрассудки, если им назначают конкретные профессиональные роли. При имитации высокостатусных или низкостатусных позиций модели начинают демонстрировать соответствующие паттерны поведения, отражающие стереотипы о власти и доминировании, заложенные в обучающих данных, что ставит под вопрос нейтральность ИИ-ассистентов в корпоративной среде.

Ученые проанализировали, как изменение «промпта-роли» влияет на тон, уверенность и манеру общения моделей. Выяснилось, что при присвоении ролей с разным уровнем социального статуса ИИ начинает неосознанно копировать динамику власти, характерную для человеческих взаимодействий. Это проявляется в изменении лексики, степени категоричности суждений и готовности идти на компромисс, что делает ответы моделей предвзятыми в зависимости от контекста задачи.

Данный эффект представляет серьезную проблему для разработчиков, стремящихся к созданию объективных систем. Поскольку модели обучаются на огромных массивах текстов, созданных людьми, они неизбежно впитывают исторические и социальные неравенства. Принудительное назначение ролей лишь активирует эти скрытые паттерны, превращая ИИ из нейтрального инструмента в активного участника социальных стереотипов, что требует внедрения новых методов фильтрации и контроля за поведением моделей в агентных сценариях.

Ключевые факты

Исследование подтвердило, что LLM адаптируют стиль общения под заданный социальный статус, имитируя человеческие иерархии.
Модели демонстрируют повышенную уверенность и доминирование при выполнении ролей «руководителей» и становятся более уступчивыми в ролях «подчиненных».
Поведенческие сдвиги происходят из-за глубокой интеграции человеческих социальных паттернов в обучающие выборки моделей.
Результаты подчеркивают необходимость разработки механизмов «дебайасинга» (устранения предвзятости) для ИИ, работающего в клиентском сервисе и HR-сфере.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

← Все материалы