arXiv · 18.06.2026 ·Оценка и бенчмарки

Исследование StylisticBias: как визуальные стили влияют на предвзятость мультимодальных ИИ

Исследователи представили бенчмарк StylisticBias, предназначенный для анализа того, как визуальные признаки на изображениях провоцируют социальные предубеждения в мультимодальных больших языковых моделях (MLLM). В отличие от предыдущих подходов, которые сравнивали реакции моделей на разных людей, новый метод изолирует конкретные визуальные стилистические сигналы, такие как одежда, прическа или аксессуары, сохраняя при этом идентичность субъекта неизменной.

Эксперименты показали, что значительная часть оценочных суждений моделей формируется на основе поверхностных визуальных атрибутов, а не реальных характеристик личности. Даже при минимальных изменениях в стиле изображения модели склонны менять свои выводы о компетенции, надежности или социальном статусе человека. Это подтверждает, что текущие архитектуры MLLM крайне чувствительны к визуальным стереотипам, заложенным в обучающих данных.

Полученные результаты подчеркивают необходимость разработки новых методов фильтрации данных и настройки моделей, чтобы минимизировать влияние визуальных стилей на принятие решений в социально значимых сферах. Авторы работы отмечают, что понимание механизмов формирования таких искажений является критически важным шагом для повышения объективности систем компьютерного зрения и мультимодального анализа.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

Hacker News · Исследования и наука Исследование склонности LLM к стереотипному мышлению Исследователи проанализировали склонность современных языковых моделей к воспроизведению социальных стереотипов. В ходе экспериментов выяснилось, что даже при нейтральных запросах нейросети демонстрируют устойчивые паттерны предвзятости, основанные на демографических и культурных данных. Работа подчеркивает сложность достижения объективности в генеративных системах, так как модели обучаются на массивах данных, содержащих исторические и общественные предубеждения. Hacker News · Исследования и наука Исследование: языковые модели демонстрируют предвзятость, отличную от человеческой Новое исследование показывает, что современные LLM склонны соглашаться друг с другом в оценках и суждениях, однако их мнение часто расходится с позицией реальных пользователей. Анализ выявил, что модели формируют специфические «консенсусы», которые не отражают человеческое разнообразие взглядов, что создает риски при использовании ИИ в качестве советчика или инструмента для принятия решений в социокультурных вопросах. Hacker News · Исследования и наука LLM перенимают социальные предубеждения в зависимости от присвоенных ролей Исследование показало, что большие языковые модели склонны воспроизводить человеческие социальные иерархии и предрассудки, если им назначают конкретные профессиональные роли. При имитации высокостатусных или низкостатусных позиций модели начинают демонстрировать соответствующие паттерны поведения, отражающие стереотипы о власти и доминировании, заложенные в обучающих данных, что ставит под вопрос нейтральность ИИ-ассистентов в корпоративной среде. arXiv · Исследования и наука Исследование: как «предвзятость значимости» мешает LLM в здравом смысле Исследователи выявили критическую уязвимость современных больших языковых моделей, названную «предвзятостью значимости» (Salience Bias). В задачах на здравый смысл модели склонны чрезмерно полагаться на явные, но бесполезные детали во входных данных, такие как случайные числа или второстепенные условия. Это приводит к игнорированию контекста и логическим ошибкам, даже если модель способна решать сложные задачи. Hacker News · Исследования и наука Исследование: как генеративные модели закрепляют социальные стереотипы Масштабное исследование Rest of World выявило, что популярные генераторы изображений, такие как Midjourney, систематически воспроизводят и усиливают культурные и гендерные стереотипы. Анализ тысяч генераций показал, что модели склонны визуализировать определенные профессии и социальные роли через узкие шаблоны, игнорируя глобальное разнообразие и реальную демографическую картину мира в пользу западных стандартов. arXiv · Оценка и бенчмарки Исследование влияния формы выражения убеждений на ответы LLM Исследователи проанализировали, как лингвистические нюансы в запросах пользователей влияют на способность LLM различать факты и субъективные убеждения. Работа показывает, что использование пресуппозиций, маркеров уверенности и различных тональностей в сообщениях существенно меняет поведение моделей, заставляя их либо принимать контекст пользователя как истину, либо опираться на собственные внутренние знания. Hacker News · Оценка и бенчмарки Исследование галлюцинаций мультимодальных моделей при анализе изображений Исследователь Пол Шеперд продемонстрировал склонность современных мультимодальных моделей к уверенным галлюцинациям при работе с визуальными данными. В ходе эксперимента ИИ-модель описывала детали изображения, которое технически не было доступно для анализа, демонстрируя «уверенную ложь» и выдумывая объекты, основываясь на контексте диалога, а не на реальных пикселях, что ставит под вопрос надежность визуального ИИ-анализа. arXiv · Оценка и бенчмарки Исследование эволюции ошибок в мультимодальных моделях за последнее десятилетие Исследователи проанализировали прогресс Vision-Language моделей (VLM) за последние десять лет, выявив критические недостатки в существующих методах оценки. Традиционные бенчмарки, такие как MS-COCO, опираются на простые визуальные сцены и не учитывают сложные социальные взаимодействия. Авторы представили новый набор данных Complex Social Behavior (CSB), предназначенный для глубокого анализа визуально-когнитивных ошибок ИИ в реальных сценариях. arXiv · Машинное обучение Новый метод обучения мультимодальных моделей через разделение восприятия и рассуждения Исследователи представили метод обучения мультимодальных моделей, который решает проблему «коротких путей» при использовании самодистилляции. Традиционный подход, при котором модель обучается на собственных результатах с опорой на эталонные данные, часто приводит к тому, что мультимодальные системы игнорируют визуальный контекст, полагаясь исключительно на текстовые подсказки. Новый алгоритм разделяет процессы восприятия изображения и логического рассуждения, что заставляет модель учитывать визуальные признаки как равноправный источник информации. arXiv · Оценка и бенчмарки Исследование чувствительности мультимодальных моделей к порядку данных Исследователи представили инструмент Facet-Probe для аудита мультимодальных LLM, выявляющий критическую проблему: модели часто меняют ответы при простом изменении порядка входных данных. Стандартные бенчмарки игнорируют этот фактор, что ставит под сомнение надежность систем в реальных сценариях, где порядок предоставления информации не должен влиять на итоговый результат или логические выводы нейросети.

← Все материалы