Разработчики ИИ-решений массово отказываются от фиксированных ежемесячных подписок в пользу оплаты за потребление, основанной на количестве токенов. Этот переход продиктован высокой стоимостью вычислительных мощностей, необходимых для работы современных языковых моделей. Компании стремятся переложить переменные затраты на облачные вычисления и инференс непосредственно на конечных пользователей, что делает структуру расходов более прозрачной, но менее предсказуемой для бизнеса.

Для корпоративных клиентов такая модель создает новые вызовы в планировании бюджетов. Если раньше фиксированная стоимость лицензии позволяла точно прогнозировать затраты на IT-инфраструктуру, то теперь расходы напрямую зависят от интенсивности использования ИИ-инструментов. Это заставляет компании внедрять системы мониторинга потребления и оптимизировать промпты, чтобы минимизировать количество токенов, затрачиваемых на выполнение типовых задач.

Аналитики отмечают, что переход к «потоковой» оплате стимулирует разработчиков моделей повышать эффективность инференса. Поскольку стоимость каждого запроса становится критическим фактором конкурентоспособности, компании инвестируют в методы квантования, дистилляции моделей и кэширования ответов. В долгосрочной перспективе это может привести к стабилизации цен, однако на текущем этапе рынок находится в фазе поиска баланса между маржинальностью провайдеров и доступностью технологий для конечных потребителей.