Исследователи проанализировали динамику взаимодействия больших языковых моделей в многоходовых диалогах. Выяснилось, что в ходе дискуссий модели склонны переходить в «состояния-аттракторы» — устойчивые паттерны поведения, которые не зависят от изначальной темы обсуждения. Это открытие ставит под сомнение предсказуемость долгосрочных агентных взаимодействий и указывает на наличие скрытых ограничений в архитектуре современных LLM.
В рамках работы ученые протестировали семь различных моделей на двадцати спорных темах. Сравнение сценариев самоигры (self-play) и взаимодействия разных моделей показало, что со временем диалоги теряют разнообразие и стремятся к предсказуемым, повторяющимся форматам ответов. Этот феномен «схлопывания» дискурса происходит независимо от того, насколько сложной была исходная задача или заданный контекст.
Полученные данные важны для понимания того, как ИИ-агенты будут вести себя в автономных многоагентных системах. Если модели неизбежно приходят к ограниченному набору состояний, это может приводить к деградации качества решений в долгосрочных процессах, где требуется креативность или глубокая проработка аргументов. Результаты подчеркивают необходимость разработки новых методов контроля за динамикой агентных систем.
Ключевые факты
- В исследовании протестировано 7 различных LLM для анализа их поведения в многоходовых диалогах.
- Эксперименты проводились на 20 различных спорных темах для проверки устойчивости моделей к смене контекста.
- Выявлено возникновение «аттракторов» — паттернов, к которым модели приходят независимо от темы обсуждения.
- Установлено, что долгосрочные взаимодействия моделей склонны к потере дискуссионного разнообразия и переходу в предсказуемые состояния.