Исследователи представили бенчмарк StylisticBias, предназначенный для анализа того, как визуальные признаки на изображениях провоцируют социальные предубеждения в мультимодальных больших языковых моделях (MLLM). В отличие от предыдущих подходов, которые сравнивали реакции моделей на разных людей, новый метод изолирует конкретные визуальные стилистические сигналы, такие как одежда, прическа или аксессуары, сохраняя при этом идентичность субъекта неизменной.
Эксперименты показали, что значительная часть оценочных суждений моделей формируется на основе поверхностных визуальных атрибутов, а не реальных характеристик личности. Даже при минимальных изменениях в стиле изображения модели склонны менять свои выводы о компетенции, надежности или социальном статусе человека. Это подтверждает, что текущие архитектуры MLLM крайне чувствительны к визуальным стереотипам, заложенным в обучающих данных.
Полученные результаты подчеркивают необходимость разработки новых методов фильтрации данных и настройки моделей, чтобы минимизировать влияние визуальных стилей на принятие решений в социально значимых сферах. Авторы работы отмечают, что понимание механизмов формирования таких искажений является критически важным шагом для повышения объективности систем компьютерного зрения и мультимодального анализа.