NVIDIA Technical Blog · 04.06.2026 ·Оркестрация агентов

NVIDIA Nemotron 3 Ultra для ускорения работы ИИ-агентов

NVIDIA Nemotron 3 Ultra для ускорения работы ИИ-агентов

NVIDIA представила новую версию своей модели Nemotron 3 Ultra, оптимизированную для работы с долгосрочными ИИ-агентами. Это важный шаг в развитии инфраструктуры для агентов, так как модель позволяет значительно ускорить процесс инференса и повысить эффективность работы с контекстом.

Nemotron 3 Ultra поддерживает до 128K токенов, что позволяет агентам сохранять контекст на протяжении длительных диалогов и сессий. Это особенно важно для агентов, которые должны выполнять сложные задачи, требующие многократного обращения к предыдущим данным и инструментам.

Модель также оптимизирована для работы с инструментами и внешними API, что делает её полезной для разработчиков, создающих агентов, которые должны взаимодействовать с различными сервисами и системами. NVIDIA утверждает, что Nemotron 3 Ultra обеспечивает более быструю и точную обработку запросов по сравнению с предыдущими версиями.

Для команды, работающей над ИИ-агентом Jarv, эта новость особенно важна, так как она предлагает новые возможности для оптимизации инференса и улучшения производительности. Использование Nemotron 3 Ultra может помочь в создании более эффективных и надежных агентов, способных выполнять сложные задачи с минимальными задержками.

Источник: NVIDIA Technical Blog

Обсудить с ИИ

Похожие материалы

NVIDIA Technical Blog · Инфраструктура для агентов NVIDIA представляет Hermes Agent и NemoClaw для саморазвивающихся агентов NVIDIA анонсировала новую инфраструктуру для развертывания саморазвивающихся ИИ-агентов, которая включает Hermes Agent и NVIDIA NemoClaw. Эта платформа предназначена для ускорения исследовательских процессов, синтеза данных и принятия решений на основе аналитики. NVIDIA Technical Blog · Инференс и железо NVIDIA JetPack 7.2 для развёртывания ИИ-агентов на краю сети NVIDIA представила JetPack 7.2 — обновление для платформы Jetson, предназначенной для развёртывания ИИ-агентов на устройствах с ограниченными ресурсами. Новая версия оптимизирует работу агентов на краю сети, что особенно важно для задач, требующих низкой задержки и автономности. NVIDIA Technical Blog · Инфраструктура для агентов NVIDIA представила процессор Vera для ускорения агентных ИИ-систем NVIDIA анонсировала процессор Vera, специально разработанный для оптимизации инфраструктуры «ИИ-фабрик». Чип нацелен на повышение пропускной способности при выполнении сложных агентных рабочих процессов, включающих многошаговое рассуждение, вызов внешних инструментов, выполнение кода и RAG-операции. Новое решение призвано устранить узкие места в производительности при масштабировании автономных ИИ-агентов в корпоративных средах. NVIDIA Technical Blog · Обучение и дообучение Упрощение дообучения модели NVIDIA Nemotron-3 Nano через платформу Prime Intellect NVIDIA представила решение для ускорения кастомизации компактной модели Nemotron-3 Nano, интегрировав её в платформу Prime Intellect. Инструмент позволяет разработчикам адаптировать модель под специфические доменные задачи и языки за считанные минуты, минимизируя вычислительные затраты и техническую сложность процесса дообучения, что критически важно для создания специализированных ИИ-агентов и локальных сервисов. Hugging Face - Blog · Безопасность и алайнмент NVIDIA представила Nemotron 3.5 Content Safety для безопасного ИИ NVIDIA анонсировала Nemotron 3.5 Content Safety — решение для обеспечения безопасности контента в мультимодальных ИИ-системах. Это обновление позволяет компаниям настраивать фильтры контента под свои нужды, что особенно важно для разработчиков ИИ-агентов, работающих с пользовательскими данными. NVIDIA Technical Blog · Оркестрация агентов NVIDIA Vera CPU: новый стандарт для агентных нагрузок NVIDIA представила новую линейку процессоров Vera, разработанных специально для работы с агентными нагрузками в AI-фабриках. Эти процессоры предназначены для оптимизации задач, связанных с оркестрацией, планированием и выполнением действий ИИ-агентов, что делает их важным шагом в развитии инфраструктуры для агентов. Together.ai · Инференс и железо Together AI запустила NVIDIA Nemotron 3 Super для разработчиков Together AI объявила о доступности модели NVIDIA Nemotron 3 Super на своей платформе Dedicated Inference. Это решение обеспечивает эффективное многоагентное рассуждение, поддерживает контекстное окно в 1 миллион токенов и готово к промышленному развёртыванию на управляемой инфраструктуре. NVIDIA Technical Blog · Инференс и железо Новые инструменты от Microsoft и NVIDIA для запуска ИИ-агентов на Windows Microsoft и NVIDIA представили новые инструменты, которые позволяют запускать ИИ-агентов на Windows ПК. Это важный шаг для разработчиков, так как ранее подобные решения требовали сложной настройки и мощного оборудования. NVIDIA Technical Blog · Инференс и железо Запуск мультимодальных моделей на GPU NVIDIA NVIDIA представила обновление для своей платформы Step 3.7 Flash, которое позволяет запускать мультимодальные ИИ-модели на графических процессорах с повышенной производительностью. Это решение ориентировано на корпоративных пользователей и предоставляет инструменты для работы с изображениями, документами, видео и другими типами данных. NVIDIA Technical Blog · Модели и релизы NVIDIA представила модель Nemotron-3 Ultra для автоматизации проектирования микросхем NVIDIA выпустила модель Nemotron-3 Ultra, оптимизированную для задач проектирования микросхем на уровне регистровых передач (RTL). Новинка демонстрирует высокую точность и эффективность при генерации и верификации кода, сокращая время инженерных циклов. Модель превосходит существующие открытые аналоги в специализированных задачах разработки аппаратного обеспечения, предлагая новый стандарт производительности для агентных систем в EDA-индустрии.

← Все материалы