Компания Anthropic обновила условия использования своего API, существенно повысив лимиты запросов для разработчиков. Увеличение пропускной способности позволяет создавать более сложные агентные системы и масштабировать приложения, работающие с моделями Claude 3.5 Sonnet и Claude 3 Opus, без необходимости частой обработки ошибок 429 (Too Many Requests) и внедрения сложных механизмов ожидания.
Изменения направлены на поддержку высоконагруженных продакшн-систем, где требуется интенсивная работа с контекстом и высокая частота вызовов. Повышение лимитов касается как количества запросов в минуту (RPM), так и общего объема обрабатываемых токенов в минуту (TPM). Это упрощает интеграцию моделей в корпоративные пайплайны, требующие параллельной обработки данных и работы нескольких агентов одновременно.
Для разработчиков это означает возможность более гибкого проектирования архитектуры RAG-систем и автоматизированных рабочих процессов. Снятие жестких ограничений снижает требования к инфраструктуре кэширования и очередям сообщений на стороне клиента, позволяя сфокусироваться на качестве промптов и логике взаимодействия моделей с внешними инструментами.
Ключевые факты
- Anthropic официально увеличила лимиты RPM (Requests Per Minute) и TPM (Tokens Per Minute) для всех уровней доступа к API.
- Обновление затрагивает актуальные модели семейства Claude 3.5 и Claude 3, включая Sonnet и Opus.
- Новые лимиты доступны в консоли разработчика и автоматически применяются к текущим тарифным планам.
- Увеличение пропускной способности направлено на снижение задержек в агентных сценариях и высоконагруженных API-интеграциях.