Hacker News · 17.06.2026 ·Оценка и бенчмарки

Метод Лос-Аламосской лаборатории для выявления галлюцинаций в мультимодальных моделях

Исследователи из Лос-Аламосской национальной лаборатории представили новый подход к диагностике ошибок в работе мультимодальных моделей, объединяющих зрение и язык. Основная проблема таких систем заключается в склонности к «галлюцинациям» — генерации описаний объектов или событий, которых нет на исходном изображении. Разработанный метод позволяет более точно отслеживать соответствие между визуальными данными и текстовым выводом модели.

Технология основана на анализе того, как модель соотносит конкретные области изображения с ключевыми словами в ответе. В процессе тестирования алгоритм выявляет логические разрывы, когда модель уверенно описывает детали, не имеющие подтверждения в пиксельной структуре картинки. Это дает возможность количественно оценить надежность ИИ-систем в задачах, требующих высокой точности интерпретации визуального контента, таких как медицинская диагностика или анализ спутниковых снимков.

Внедрение этого метода помогает разработчикам лучше понимать внутренние механизмы принятия решений нейросетями. Вместо того чтобы полагаться на общие показатели точности, исследователи получают детальную карту «неуверенности» модели. Это позволяет не только фиксировать ошибки, но и проводить более качественную донастройку систем, минимизируя риск искажения информации в критически важных сценариях использования.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

arXiv · Память и RAG Как RAG помогает бороться с галлюцинациями в мультимодальных моделях Исследователи из MIT и других ведущих университетов предложили новый подход к снижению визуальных галлюцинаций в мультимодальных языковых моделях (MLLMs). Эти системы, способные обрабатывать как текстовые, так и визуальные данные, часто демонстрируют уверенность в своих ответах, даже когда визуальные данные слабые или неоднозначные. Это приводит к так называемым "галлюцинациям" — выводам, не соответствующим реальности. arXiv · Модели и релизы Новый метод обнаружения ошибок в цепочках рассуждений LLM Исследователи из MIT и Университета Карнеги-Меллона предложили новый подход к выявлению ошибок в цепочках рассуждений языковых моделей (LLM) без использования меток. Их метод, основанный на операдной теории, позволяет обнаруживать несоответствия в логических цепочках, которые модели строят при решении сложных задач. arXiv · Исследования и наука Новый метод обучения LVLM через визуально обоснованную саморефлексию Исследователи представили метод обучения мультимодальных моделей (LVLM), который улучшает их способность к саморефлексии через подкрепление (RL). В отличие от стандартных моделей, которые часто игнорируют визуальные данные при исправлении ошибок, новый подход заставляет нейросеть опираться на исходное изображение при анализе цепочки рассуждений, что значительно повышает точность коррекции логических выводов. arXiv · Машинное обучение Новый метод обучения мультимодальных моделей через разделение восприятия и рассуждения Исследователи представили метод обучения мультимодальных моделей, который решает проблему «коротких путей» при использовании самодистилляции. Традиционный подход, при котором модель обучается на собственных результатах с опорой на эталонные данные, часто приводит к тому, что мультимодальные системы игнорируют визуальный контекст, полагаясь исключительно на текстовые подсказки. Новый алгоритм разделяет процессы восприятия изображения и логического рассуждения, что заставляет модель учитывать визуальные признаки как равноправный источник информации. arXiv · Оценка и бенчмарки Symbal: новый метод выявления систематических ошибок в мультимодальных моделях Исследователи представили Symbal — фреймворк для обнаружения систематических расхождений между изображениями и сгенерированными описаниями в мультимодальных моделях (MLLM). Метод выявляет закономерности, при которых модель стабильно ошибается в присутствии определенных визуальных признаков. Это позволяет точнее оценивать надежность моделей и выявлять скрытые дефекты в их способности интерпретировать визуальный контент, что критически важно для повышения качества генерации данных. arXiv · Оценка и бенчмарки Исследование эволюции ошибок в мультимодальных моделях за последнее десятилетие Исследователи проанализировали прогресс Vision-Language моделей (VLM) за последние десять лет, выявив критические недостатки в существующих методах оценки. Традиционные бенчмарки, такие как MS-COCO, опираются на простые визуальные сцены и не учитывают сложные социальные взаимодействия. Авторы представили новый набор данных Complex Social Behavior (CSB), предназначенный для глубокого анализа визуально-когнитивных ошибок ИИ в реальных сценариях. arXiv · Исследования и наука Мультимодальные LLM для ранней диагностики когнитивных нарушений по речи Исследователи представили новый подход к выявлению когнитивных нарушений (CI) на основе анализа речи с использованием мультимодальных больших языковых моделей. Метод объединяет лингвистические и акустические маркеры, позволяя эффективно отслеживать признаки снижения когнитивных функций. Технология предлагает неинвазивную альтернативу традиционным методам диагностики, обеспечивая высокую точность анализа и потенциал для раннего вмешательства в клинической практике. arXiv · Исследования и наука Новый метод обучения разреженных автокодировщиков для мультимодальных моделей Исследователи представили метод структурированных разреженных автокодировщиков (SAE), решающий проблему фрагментации концептов в мультимодальных моделях. Традиционные SAE часто не могут связать визуальные и текстовые представления, выделяя разрозненные признаки. Новый подход обеспечивает согласованность концептов между модальностями, что критически важно для интерпретируемости нейросетей и понимания того, как модели связывают изображения с текстом. arXiv · Исследования и наука Метод MIRROR улучшает визуальные рассуждения мультимодальных моделей Исследователи представили метод MIRROR, направленный на устранение разрыва в логических способностях мультимодальных моделей (VLM). В отличие от LLM, VLM часто демонстрируют нестабильные результаты при работе с визуальными данными, даже если задача имеет текстовый эквивалент. Новый подход обучает модели сопоставлять и интегрировать информацию из различных представлений — текста, диаграмм и их комбинаций — для повышения точности рассуждений. arXiv · Исследования и наука Новый метод анализа некорректных запросов к LLM через топологию данных Исследователи представили новый подход к выявлению и обработке некорректных запросов в больших языковых моделях, используя методы топологического анализа данных. Проблема «плохо поставленных» вопросов, которые содержат противоречия, двусмысленность или недостаток контекста, остается критической для точности ответов ИИ. Традиционные методы анализа обычно фокусируются на изучении уже готовых ответов модели, что не позволяет эффективно выявлять саму природу ошибки на этапе ввода.

← Все материалы