Исследование показывает прямую зависимость между стилем написания кода и расходами на API при работе с большими языковыми моделями. Автор проанализировал, как форматирование, использование комментариев и структура кода влияют на количество потребляемых токенов. Оптимизация стиля позволяет существенно снизить затраты на инференс без потери функциональности и читаемости программных решений при использовании LLM для генерации или рефакторинга.

Основная проблема заключается в избыточности символов, которые модели интерпретируют как дополнительные токены. Например, использование длинных имен переменных, специфических стилей отступов или чрезмерное количество документации внутри кода увеличивает стоимость каждого запроса. Разработчики могут сократить расходы, внедряя стандарты кодирования, которые минимизируют «шум» для модели, сохраняя при этом семантическую ясность.

Результаты подчеркивают важность осознанного подхода к промпт-инжинирингу и подготовке контекста для моделей. Вместо того чтобы полагаться на стандартные стили оформления, ориентированные исключительно на человека, стоит учитывать особенности токенизации конкретных моделей. Это позволяет находить баланс между удобством сопровождения кода и экономической эффективностью при масштабировании агентных систем.

Ключевые факты

  • Избыточное форматирование кода может увеличивать стоимость запроса на 15–30% в зависимости от используемой модели.
  • Использование коротких, но понятных имен переменных и минимизация лишних пробелов напрямую снижают количество потребляемых токенов.
  • Комментарии в коде, предназначенном для обработки LLM, требуют оптимизации: их объем должен быть достаточным для понимания, но не избыточным для токенизатора.
  • Выбор стиля кодирования влияет на предсказательную способность модели, так как некоторые структуры данных требуют большего количества токенов для описания связей.