AI News & Artificial Intelligence | TechCrunch · 24.06.2026 ·ИИ в бизнесе

Компании переходят от бесконтрольного использования ИИ к жесткому лимитированию токенов

Бизнес столкнулся с проблемой неконтролируемого роста расходов на генеративный ИИ из-за массового использования API сотрудниками для мелких повседневных задач. Компании массово внедряют системы токен-менеджмента и жесткого квотирования, чтобы предотвратить истощение бюджетов. Эра «tokenmaxxing», когда доступ к мощным моделям был безлимитным, сменяется периодом рационального потребления вычислительных ресурсов и оптимизации затрат на инференс.

Масштаб проблемы стал очевиден, когда счета за облачные ИИ-сервисы начали превышать прогнозы финансового планирования. Сотрудники часто используют дорогие флагманские модели для простых операций, которые могли бы выполняться более дешевыми и компактными решениями. В ответ на это ИТ-отделы внедряют прослойки для мониторинга, которые анализируют потребление токенов в реальном времени и автоматически блокируют или перенаправляют запросы на менее затратные модели.

Стратегия компаний смещается в сторону гибридного подхода: использование специализированных моделей для конкретных задач вместо универсальных решений общего назначения. Это позволяет не только снизить финансовую нагрузку, но и повысить безопасность данных, ограничивая передачу конфиденциальной информации во внешние API. Внедрение систем контроля становится обязательным этапом цифровой трансформации для предприятий, активно интегрирующих ИИ в рабочие процессы.

Ключевые факты

Компании переходят от модели свободного доступа к ИИ-инструментам к жесткому лимитированию токенов на каждого сотрудника.
Основная причина изменений — непредсказуемый рост счетов за использование API, вызванный выполнением тривиальных задач на дорогих моделях.
Внедряются системы мониторинга, которые автоматически перенаправляют запросы на более дешевые и эффективные модели в зависимости от сложности задачи.
Оптимизация затрат становится приоритетом для ИТ-департаментов, стремящихся сохранить ROI от внедрения генеративного ИИ в корпоративную среду.

Источник: AI News & Artificial Intelligence | TechCrunch

Обсудить с ИИ

Похожие материалы

← Все материалы