Представлен Wyolet Relay — инструмент с открытым исходным кодом, предназначенный для маршрутизации запросов к большим языковым моделям. Решение ориентировано на обеспечение высокой пропускной способности и эффективное управление трафиком в сложных агентных системах, где требуется распределение нагрузки между различными моделями или провайдерами инференса.

Система позволяет оптимизировать работу с LLM, минимизируя задержки и повышая надежность взаимодействия за счет интеллектуального распределения запросов. Использование подобных маршрутизаторов становится критически важным компонентом архитектуры при масштабировании приложений, использующих API различных моделей, так как они позволяют гибко управлять затратами и производительностью в реальном времени.

Проект предоставляет разработчикам инфраструктурный слой для контроля потоков данных, что упрощает интеграцию нескольких моделей в единый конвейер обработки. Wyolet Relay выступает в роли промежуточного звена, обеспечивающего стабильность работы агентных систем при пиковых нагрузках и необходимости переключения между различными вычислительными мощностями.