Разработан новый подход к верификации ответов языковых моделей, основанный на архитектуре консенсуса. Система задействует одновременно 11 различных LLM для обработки одного и того же запроса, после чего проводит сравнительный анализ полученных результатов. Такой метод позволяет выявлять противоречия и фактические ошибки, которые могут возникать при работе одиночных моделей.
В основе решения лежит механизм сопоставления ответов, где каждая модель выступает в роли независимого эксперта. Если большинство моделей приходят к схожим выводам, ответ считается достоверным. В случаях, когда ответы существенно различаются, система помечает информацию как потенциально недостоверную, что значительно снижает вероятность генерации галлюцинаций в критически важных задачах.
Данная архитектура ориентирована на интеграцию в агентные системы, где точность данных имеет приоритетное значение. Использование ансамбля моделей позволяет нивелировать недостатки отдельных архитектур и повысить общую надежность автоматизированных процессов принятия решений без необходимости дообучения базовых моделей.