Исследователи представили новый подход к объединению нескольких специализированных нейросетевых экспертов в одну многозадачную модель. Традиционные методы слияния весов часто сталкиваются с проблемой интерференции параметров, когда знания одной модели конфликтуют с другой, что приводит к снижению точности по сравнению с исходными узкоспециализированными версиями.

Предложенный метод использует классификацию задач без необходимости дополнительного обучения (training-free). Система динамически определяет тип входящего запроса и активирует только те компоненты объединенной модели, которые наиболее эффективны для решения конкретной задачи. Это позволяет избежать негативного влияния параметров, не относящихся к текущему контексту, и сохранить производительность на уровне отдельных экспертов.

Технология опирается на механизм маршрутизации, который распределяет нагрузку между частями модели в режиме реального времени. Такой подход упрощает развертывание сложных систем, так как избавляет от необходимости хранить и поддерживать множество отдельных моделей для разных задач, предлагая более компактное и эффективное решение для многозадачных сценариев.