Авторы новой научной работы из arXiv ставят под сомнение статус больших языковых моделей (LLM) как полноценных универсальных решателей задач. Основной аргумент заключается в том, что естественный язык является сжатым и ограниченным по емкости интерфейсом для передачи инструкций. Это создает фундаментальный барьер при попытке передать модели сложную задачу через промпт.
В исследовании взаимодействие пользователя и системы моделируется как «игра с дешевым общением» (cheap-talk game). Такой подход позволяет проанализировать, как скрытые параметры задачи кодируются в текстовые запросы и какие потери информации при этом возникают. Математический анализ показывает, что промпт-инжиниринг не всегда способен компенсировать нехватку данных о контексте, что ограничивает эффективность моделей при выполнении узкоспециализированных или высокоточных задач.
Результаты работы указывают на необходимость пересмотра подходов к обучению и настройке моделей. Вместо того чтобы полагаться исключительно на возможности LLM по интерпретации естественного языка, разработчикам предлагается учитывать ограничения пропускной способности текстового интерфейса. Это может привести к развитию более эффективных методов передачи контекста и структурных данных, которые выходят за рамки классического промптинга.