Крупные компании начали сокращать бюджеты на использование API от OpenAI и Anthropic, сталкиваясь с высокими операционными затратами и отсутствием измеримого ROI. Бизнес переходит от масштабных экспериментов с генеративным ИИ к более прагматичному подходу, отдавая предпочтение специализированным моделям и локальным решениям, которые позволяют лучше контролировать расходы и обеспечивать предсказуемую эффективность внедрения.

Основная проблема заключается в том, что стоимость токенов при масштабировании на тысячи сотрудников или миллионы клиентских запросов становится непомерно высокой. Компании, которые ранее инвестировали в универсальные LLM, теперь обнаруживают, что затраты на поддержку инфраструктуры и дообучение моделей не приносят ожидаемого роста выручки или существенной экономии на автоматизации процессов. В результате многие организации приостанавливают расширение текущих проектов, требуя от ИИ-отделов более строгих доказательств экономической целесообразности.

Наблюдается тренд на «оптимизацию инференса»: вместо использования самых мощных и дорогих моделей вроде GPT-4 или Claude 3.5 Sonnet, разработчики переходят на более компактные и дешевые аналоги (SLM) или используют методы дистилляции. Это позволяет снизить нагрузку на бюджет, сохраняя при этом приемлемое качество ответов для узкоспециализированных корпоративных задач. Компании также чаще выбирают open-source модели, которые можно развернуть на собственной инфраструктуре, исключая зависимость от ценовой политики крупных провайдеров.

Ключевые факты

  • Корпоративные клиенты массово пересматривают контракты с OpenAI и Anthropic из-за сложности масштабирования затрат.
  • Основной барьер для внедрения — отсутствие прозрачного ROI и высокая стоимость инференса при работе с большими объемами данных.
  • Компании переходят на использование более дешевых моделей или локальный хостинг для контроля над расходами.
  • Акцент смещается с «хайповых» внедрений на поиск конкретных бизнес-кейсов с доказанной экономической эффективностью.