arXiv · 29.06.2026 ·Исследования и наука

Исследование: в диалогах LLM между собой возникают устойчивые состояния-аттракторы

Исследователи проанализировали динамику взаимодействия больших языковых моделей в многоходовых диалогах. Выяснилось, что в ходе дискуссий модели склонны переходить в «состояния-аттракторы» — устойчивые паттерны поведения, которые не зависят от изначальной темы обсуждения. Это открытие ставит под сомнение предсказуемость долгосрочных агентных взаимодействий и указывает на наличие скрытых ограничений в архитектуре современных LLM.

В рамках работы ученые протестировали семь различных моделей на двадцати спорных темах. Сравнение сценариев самоигры (self-play) и взаимодействия разных моделей показало, что со временем диалоги теряют разнообразие и стремятся к предсказуемым, повторяющимся форматам ответов. Этот феномен «схлопывания» дискурса происходит независимо от того, насколько сложной была исходная задача или заданный контекст.

Полученные данные важны для понимания того, как ИИ-агенты будут вести себя в автономных многоагентных системах. Если модели неизбежно приходят к ограниченному набору состояний, это может приводить к деградации качества решений в долгосрочных процессах, где требуется креативность или глубокая проработка аргументов. Результаты подчеркивают необходимость разработки новых методов контроля за динамикой агентных систем.

Ключевые факты

В исследовании протестировано 7 различных LLM для анализа их поведения в многоходовых диалогах.
Эксперименты проводились на 20 различных спорных темах для проверки устойчивости моделей к смене контекста.
Выявлено возникновение «аттракторов» — паттернов, к которым модели приходят независимо от темы обсуждения.
Установлено, что долгосрочные взаимодействия моделей склонны к потере дискуссионного разнообразия и переходу в предсказуемые состояния.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

← Все материалы