Исследователи из Лос-Аламосской национальной лаборатории представили новый подход к диагностике ошибок в работе мультимодальных моделей, объединяющих зрение и язык. Основная проблема таких систем заключается в склонности к «галлюцинациям» — генерации описаний объектов или событий, которых нет на исходном изображении. Разработанный метод позволяет более точно отслеживать соответствие между визуальными данными и текстовым выводом модели.
Технология основана на анализе того, как модель соотносит конкретные области изображения с ключевыми словами в ответе. В процессе тестирования алгоритм выявляет логические разрывы, когда модель уверенно описывает детали, не имеющие подтверждения в пиксельной структуре картинки. Это дает возможность количественно оценить надежность ИИ-систем в задачах, требующих высокой точности интерпретации визуального контента, таких как медицинская диагностика или анализ спутниковых снимков.
Внедрение этого метода помогает разработчикам лучше понимать внутренние механизмы принятия решений нейросетями. Вместо того чтобы полагаться на общие показатели точности, исследователи получают детальную карту «неуверенности» модели. Это позволяет не только фиксировать ошибки, но и проводить более качественную донастройку систем, минимизируя риск искажения информации в критически важных сценариях использования.