Компания Anthropic обновила условия использования своего API, существенно повысив лимиты запросов для разработчиков. Увеличение пропускной способности позволяет создавать более сложные агентные системы и масштабировать приложения, работающие с моделями Claude 3.5 Sonnet и Claude 3 Opus, без необходимости частой обработки ошибок 429 (Too Many Requests) и внедрения сложных механизмов ожидания.

Изменения направлены на поддержку высоконагруженных продакшн-систем, где требуется интенсивная работа с контекстом и высокая частота вызовов. Повышение лимитов касается как количества запросов в минуту (RPM), так и общего объема обрабатываемых токенов в минуту (TPM). Это упрощает интеграцию моделей в корпоративные пайплайны, требующие параллельной обработки данных и работы нескольких агентов одновременно.

Для разработчиков это означает возможность более гибкого проектирования архитектуры RAG-систем и автоматизированных рабочих процессов. Снятие жестких ограничений снижает требования к инфраструктуре кэширования и очередям сообщений на стороне клиента, позволяя сфокусироваться на качестве промптов и логике взаимодействия моделей с внешними инструментами.

Ключевые факты

  • Anthropic официально увеличила лимиты RPM (Requests Per Minute) и TPM (Tokens Per Minute) для всех уровней доступа к API.
  • Обновление затрагивает актуальные модели семейства Claude 3.5 и Claude 3, включая Sonnet и Opus.
  • Новые лимиты доступны в консоли разработчика и автоматически применяются к текущим тарифным планам.
  • Увеличение пропускной способности направлено на снижение задержек в агентных сценариях и высоконагруженных API-интеграциях.