Компания Factory представила инструмент для автоматической маршрутизации запросов между различными языковыми моделями. Система в режиме реального времени анализирует входящие задачи и перенаправляет их на наиболее подходящую модель, исходя из заданных параметров стоимости и времени отклика. Такой подход позволяет компаниям снизить расходы на API, не жертвуя качеством ответов в критически важных сценариях.

Технология работает как промежуточный слой, который динамически выбирает между флагманскими моделями с высокой производительностью и более легкими, бюджетными версиями. Маршрутизатор учитывает сложность запроса и текущую нагрузку на инфраструктуру провайдеров, что позволяет балансировать между точностью генерации и операционными затратами. Это решение направлено на автоматизацию выбора вычислительных мощностей в сложных агентных системах, где использование одной модели для всех типов задач становится экономически неэффективным.

Инструмент поддерживает интеграцию с популярными LLM, позволяя разработчикам настраивать политики переключения без изменения основной логики приложений. Внедрение подобных систем маршрутизации становится стандартом для масштабируемых ИИ-сервисов, стремящихся минимизировать задержки при обработке пользовательских запросов и оптимизировать бюджет на инференс.