Together.ai · 18.05.2026 ·Инференс и железо

Сравнение производительности кодирующих агентов

Сравнение производительности кодирующих агентов

Компания Together.ai провела бенчмарк производительности кодирующих агентов в реальных условиях. По результатам тестов, их решение показало 31% больше транзакций в секунду (TPS) по сравнению с TensorRT-LLM. Также отмечено в два раза лучшее время первого ответа (TTFT) при насыщении системы и на 76% более низкие затраты по сравнению с моделью Claude Opus 4.6.

В исследовании подробно описаны методы тестирования и сравнения различных параметров производительности. Особое внимание уделено эффективности работы агентов при высоких нагрузках, что критически важно для промышленного применения.

Результаты демонстрируют значительные преимущества в скорости и стоимости, что может повлиять на выбор решений для внедрения ИИ в производственные процессы. Вместе с тем, авторы подчеркивают важность дальнейших исследований для оптимизации работы агентов в различных сценариях использования.

Подробности исследования доступны на сайте Together.ai.

Источник: Together.ai

Обсудить с ИИ

Похожие материалы

Together.ai · Инфраструктура для агентов ThunderAgent: ускорение агентного инференса в два раза Together AI представила ThunderAgent — планировщик для агентного инференса, оптимизирующий выполнение сложных рабочих процессов. Система рассматривает агентные цепочки как планируемые программы, что позволяет устранить избыточное использование KV-кэша. В результате пропускная способность на одном узле увеличивается более чем в два раза, обеспечивая при этом практически линейное масштабирование при работе на нескольких узлах одновременно. Hacker News · Оркестрация агентов Оптимизация агентных рабочих процессов: сокращение шагов на 83% Разработчики представили платформу Tura, ориентированную на повышение эффективности автономных ИИ-агентов. Согласно внутренним тестам, использование системы позволяет сократить количество итераций (turns) в цепочке рассуждений агента на 83,1%, при этом показатель успешного выполнения целевых задач возрастает на 16,7 процентных пунктов. Решение направлено на оптимизацию агентных пайплайнов и снижение издержек на инференс. Hacker News · ИИ в бизнесе Тестирование ИИ-агентов в реальных офисных задачах Журналисты The New York Times провели масштабный эксперимент, оценив эффективность современных ИИ-агентов в выполнении типичных офисных задач. В ходе тестирования системы пытались автоматизировать процессы обработки данных, планирования и подготовки документов, с которыми ежедневно сталкиваются сотрудники. Результаты показали как значительный потенциал в ускорении рутины, так и критические ограничения в точности и автономности при работе со сложными бизнес-сценариями. AI News · ИИ в бизнесе OpenAI представила отчет об ускорении научных разработок с помощью ИИ-агентов OpenAI опубликовала отчет, демонстрирующий эффективность использования ИИ-агентов для оптимизации процессов в восьми проектах в области научных вычислений. Применение инструментов для автоматизированного написания кода позволило существенно сократить время выполнения задач. В исследовании рассматривались кейсы, где задействовались как собственные модели компании, так и решения от Anthropic, подтверждая прикладную пользу агентных систем в сложных технических средах. OpenAI News · ИИ в бизнесе Исследование OpenAI: как ИИ-агенты меняют структуру рабочих процессов Новое исследование OpenAI демонстрирует, как внедрение ИИ-агентов трансформирует выполнение рабочих задач. В отличие от простых чат-ботов, агенты способны брать на себя длительные, многоэтапные процессы, требующие автономности и планирования. Это приводит к существенному росту продуктивности сотрудников, позволяя им делегировать рутинные операции и фокусироваться на более сложных аналитических задачах, что меняет привычные стандарты эффективности в различных отраслях. Hacker News · Модели и релизы Анализ производительности Claude 3.5 Sonnet в агентных задачах Исследовательская платформа Artificial Analysis оценила эффективность новой модели Claude 3.5 Sonnet в агентных сценариях. Модель демонстрирует высокую точность при выполнении многошаговых задач, однако требует значительных вычислительных затрат. Аналитики сравнили показатели модели с конкурентами, отметив баланс между качеством принятия решений и стоимостью одного рабочего цикла в агентных архитектурах. Together.ai · Инференс и железо Together AI представила новые решения для инференса и агентов на NVIDIA GTC 2026 Together AI выступила на конференции NVIDIA GTC 2026 с рядом новых разработок. В фокусе — инференс, агентные технологии, голосовой ИИ и открытые модели. Компания также провела технические сессии, где её исследователи и инженеры поделились деталями новых решений. Hacker News · ИИ в бизнесе Бенчмарки эффективности ИИ-агентов в разработке ПО Разработчики представили результаты тестирования агентных систем, демонстрирующие реальное сокращение затрат на написание кода на 30%. Исследование опирается на воспроизводимые бенчмарки, оценивающие производительность ИИ-агентов при выполнении типичных задач разработки. Полученные данные подтверждают, что автоматизация рутинных процессов программирования позволяет существенно оптимизировать ресурсы без потери качества итогового продукта. Hacker News · Исследования и наука Исследование OpenAI: переход от простых LLM к агентным системам Анализ данных платформы Codex демонстрирует фундаментальный сдвиг в использовании ИИ: разработчики всё чаще делегируют моделям выполнение многошаговых задач. Вместо разовых запросов пользователи переходят к агентным паттернам, где ИИ самостоятельно планирует действия и взаимодействует с внешними инструментами. Это меняет требования к архитектуре моделей, смещая фокус с генерации текста на надежность выполнения последовательных операций. Hacker News · Инфраструктура для агентов Сравнительный анализ производительности AI Gateways: GoModel, LiteLLM, Portkey и Bifrost В июне 2026 года был проведен масштабный бенчмарк популярных AI-шлюзов, оценивающий их влияние на задержки при работе с LLM. Исследование сравнивает GoModel, LiteLLM, Portkey и Bifrost, фокусируясь на накладных расходах при маршрутизации запросов, управлении ключами и логировании. Результаты показывают значительные различия в производительности, что критически важно для масштабируемых агентных систем и высоконагруженных сервисов.

← Все материалы