Разработчики представили Maslul — инструмент для динамической маршрутизации запросов между различными языковыми моделями. Система анализирует входящий запрос и автоматически определяет, какая модель справится с задачей наиболее эффективно, учитывая баланс между качеством ответа, скоростью генерации и стоимостью вычислений.

Основная задача проекта — оптимизация затрат при работе с API крупных провайдеров. Вместо использования одной универсальной модели для всех типов задач, Maslul позволяет направлять простые запросы к более дешевым и быстрым моделям, а сложные логические или творческие задачи — к флагманским решениям. Это снижает общую нагрузку на инфраструктуру и уменьшает расходы на биллинг без потери качества итогового результата.

Инструмент интегрируется в существующие пайплайны через единый интерфейс вызова, скрывая сложность выбора модели от конечного приложения. Такая архитектура упрощает масштабирование агентных систем, позволяя гибко переключаться между вендорами и версиями моделей по мере их обновления или изменения ценовой политики провайдеров.