The Decoder · 28.06.2026 ·ИИ в бизнесе

Coinbase переходит на китайские LLM для оптимизации расходов

Coinbase переходит на китайские LLM для оптимизации расходов

Coinbase начала использовать китайские языковые модели, такие как GLM 5.2 и Kimi 2.7, для своих внутренних задач. Внедрение системы автоматической маршрутизации запросов в сочетании с улучшенным кэшированием позволило компании сократить расходы на ИИ в два раза, несмотря на постоянный рост объемов потребления токенов и сложности обрабатываемых задач.

Переход на альтернативные модели стал ответом на высокие цены западных провайдеров. Инженерная команда Coinbase разработала систему, которая в реальном времени анализирует запрос и выбирает наиболее подходящую модель, исходя из соотношения стоимости и качества выполнения конкретной задачи. Такой подход позволил значительно снизить зависимость от одного поставщика и оптимизировать бюджет на инфраструктуру.

Важным элементом стратегии стало повышение эффективности кэширования. Благодаря оптимизации процессов обработки данных, компании удалось увеличить показатель попадания в кэш (hit rate) с 5% до 60%. Это существенно снизило количество обращений к API моделей, что напрямую повлияло на итоговую стоимость эксплуатации агентных систем.

Ключевые факты

Coinbase интегрировала модели GLM 5.2 и Kimi 2.7 в свои рабочие процессы.
Расходы на ИИ сократились вдвое при сохранении или росте объемов использования токенов.
Показатель эффективности кэширования (hit rate) вырос с 5% до 60%.
Использование автоматизированной системы маршрутизации позволяет выбирать оптимальную модель для каждого конкретного запроса.

Источник: The Decoder

Обсудить с ИИ

Похожие материалы

Hacker News · ИИ в бизнесе Coinbase запускает ИИ-консультанта для анализа рынков и опционов Криптовалютная биржа Coinbase представила ИИ-инструмент, предназначенный для помощи пользователям в навигации по сложным финансовым рынкам. Система ориентирована на анализ торговых стратегий, работу с опционами и оценку активов на пред-IPO рынках. Решение призвано автоматизировать процесс обработки больших объемов рыночных данных, предоставляя инвесторам персонализированные рекомендации в режиме реального времени. AI News · ИИ в бизнесе Coinbase for Agents автоматизирует торговлю через ИИ Coinbase представила сервис Coinbase for Agents, который связывает ИИ с финансовыми каналами для автоматизации торговли и платежей. Платформа позволяет пользователям управлять инвестициями напрямую из своих портфелей с помощью ИИ-агентов. Hacker News · Прогнозы и тренды Анализ динамики цен на использование LLM за два месяца Исследование рынка API для больших языковых моделей выявило ключевые изменения в ценовой политике ведущих провайдеров за восьминедельный период. Анализ охватил стоимость токенов для широкого спектра моделей, включая флагманские решения от OpenAI, Anthropic и Google. Данные показывают, что конкуренция между разработчиками ИИ-систем перешла в фазу активного снижения стоимости инференса, что напрямую влияет на экономику внедрения генеративных инструментов в бизнес-процессы. Hacker News · Инфраструктура для агентов AI-шлюз для оптимизации расходов на токены LLM Разработчики представили специализированный AI-шлюз, предназначенный для снижения затрат на использование API больших языковых моделей. Инструмент выступает посредником между приложением и провайдером модели, внедряя механизмы кэширования и интеллектуальной маршрутизации запросов. По заявлению создателей, внедрение системы позволяет сократить расходы на токены в среднем на 40–70% в зависимости от специфики нагрузки. Hacker News · Бизнес и инвестиции Бизнес пересматривает расходы на ИИ из-за высокой стоимости токенов Компании начали массово пересматривать стратегии внедрения ИИ из-за стремительного роста операционных расходов. Высокая стоимость инференса и потребление токенов привели к тому, что многие проекты не показывают ожидаемой окупаемости. В результате бизнес переходит от масштабных экспериментов с LLM к оптимизации затрат, поиску более дешевых моделей и внедрению строгих лимитов на использование API. Hacker News · Бизнес и инвестиции Оптимизация расходов на LLM через выбор моделей под конкретные задачи Компании все чаще переплачивают за использование топовых моделей вроде GPT-4 в задачах, которые не требуют высокого уровня рассуждений. Анализ показывает, что значительная часть запросов к API приходится на простые операции: классификацию текста, извлечение сущностей или базовую суммаризацию. Для таких процессов использование флагманских нейросетей экономически нецелесообразно, так как более компактные и специализированные модели справляются с аналогичным качеством при кратно меньшей стоимости инференса. Hacker News · Инфраструктура для агентов Переход на оплату инференса LLM по затраченной энергии вместо токенов Разработчики предлагают радикально изменить модель оплаты за использование больших языковых моделей, перейдя от привычной тарификации за количество токенов к оплате за потребленную электроэнергию. Такой подход позволяет значительно оптимизировать расходы при выполнении ресурсоемких задач, снижая итоговый счет в шесть раз. Метод ориентирован на повышение прозрачности ценообразования в инфраструктуре ИИ-вычислений. Hacker News · Бизнес и инвестиции Китайские разработчики ИИ начали ценовую войну, снизив стоимость токенов до 99% Пять ведущих китайских ИИ-лабораторий, включая ByteDance, Alibaba и Baidu, объявили о радикальном снижении цен на использование своих языковых моделей. Стоимость API для некоторых моделей упала на 99%, что делает доступ к мощным вычислительным ресурсам значительно дешевле для бизнеса и разработчиков. Этот шаг знаменует переход от этапа борьбы за технологическое превосходство к агрессивной конкуренции за долю рынка и массовое внедрение ИИ-решений. AI News & Artificial Intelligence | TechCrunch · ИИ в бизнесе Компании переходят от бесконтрольного использования ИИ к жесткому лимитированию токенов Бизнес столкнулся с проблемой неконтролируемого роста расходов на генеративный ИИ из-за массового использования API сотрудниками для мелких повседневных задач. Компании массово внедряют системы токен-менеджмента и жесткого квотирования, чтобы предотвратить истощение бюджетов. Эра «tokenmaxxing», когда доступ к мощным моделям был безлимитным, сменяется периодом рационального потребления вычислительных ресурсов и оптимизации затрат на инференс. Hacker News · Прогнозы и тренды Премия за использование закрытых LLM практически исчезла Стоимость доступа к передовым закрытым моделям сравнялась с ценами на открытые аналоги, что знаменует конец эпохи «премиальной наценки» за проприетарные технологии. Анализ рынка показывает, что разрыв в производительности между закрытыми и открытыми LLM сократился до минимума, делая выбор в пользу открытых решений экономически оправданным для большинства корпоративных задач и масштабируемых агентных систем.

← Все материалы