NVIDIA представила новую версию своей модели Nemotron 3 Ultra, оптимизированную для работы с долгосрочными ИИ-агентами. Это важный шаг в развитии инфраструктуры для агентов, так как модель позволяет значительно ускорить процесс инференса и повысить эффективность работы с контекстом.
Nemotron 3 Ultra поддерживает до 128K токенов, что позволяет агентам сохранять контекст на протяжении длительных диалогов и сессий. Это особенно важно для агентов, которые должны выполнять сложные задачи, требующие многократного обращения к предыдущим данным и инструментам.
Модель также оптимизирована для работы с инструментами и внешними API, что делает её полезной для разработчиков, создающих агентов, которые должны взаимодействовать с различными сервисами и системами. NVIDIA утверждает, что Nemotron 3 Ultra обеспечивает более быструю и точную обработку запросов по сравнению с предыдущими версиями.
Для команды, работающей над ИИ-агентом Jarv, эта новость особенно важна, так как она предлагает новые возможности для оптимизации инференса и улучшения производительности. Использование Nemotron 3 Ultra может помочь в создании более эффективных и надежных агентов, способных выполнять сложные задачи с минимальными задержками.
