Исследователи выявили критический недостаток в популярных методах мультиагентных дебатов (MAD), где итоговое решение принимается простым большинством голосов. Из-за схожести обучающих данных модели часто совершают идентичные ошибки, что приводит к подавлению верных ответов, предлагаемых меньшинством. Авторы предложили механизм «Minority Sentinel», позволяющий системе распознавать ситуации, когда мнение меньшинства статистически более вероятно является правильным.
Традиционный подход к мультиагентным системам опирается на теорему Кондорсе о жюри присяжных, которая предполагает независимость ошибок участников. Однако современные LLM обучаются на пересекающихся корпусах данных, что делает их ошибки коррелированными. В результате «эффект эхо-камеры» заставляет модели игнорировать нестандартные, но верные логические выводы, если они не поддерживаются большинством агентов.
Метод Minority Sentinel анализирует внутренние состояния агентов и структуру их аргументации, чтобы выявить моменты, когда консенсус большинства становится препятствием для точности. Это позволяет динамически пересматривать результаты голосования, отдавая предпочтение обоснованным ответам меньшинства, что существенно повышает качество логического вывода в сложных задачах, требующих нестандартного мышления.
Ключевые факты
- Эффект «Minority Sentinel» возникает из-за высокой корреляции ошибок между моделями, обученными на схожих наборах данных.
- Метод позволяет автоматически определять случаи, когда голосование большинством приводит к систематическим искажениям и неверным результатам.
- Исследование ставит под сомнение эффективность стандартных стратегий агрегации ответов в мультиагентных системах (MAD).
- Предложенный подход повышает точность рассуждений в задачах, где правильный ответ не является очевидным для большинства моделей.