Исследователи представили MambAdapter — лёгкие адаптеры на основе архитектуры Mamba, предназначенные для трансфер-обучения. Новый подход позволяет эффективно переносить знания между задачами, сохраняя при этом низкие вычислительные затраты.

MambAdapter использует архитектуру Mamba, которая демонстрирует высокую эффективность в обработке длинных последовательностей. Адаптеры позволяют адаптировать предобученные модели для новых задач без полного переобучения, что снижает затраты на вычисления и время обучения.

Исследование показывает, что MambAdapter превосходит традиционные методы трансфер-обучения по точности и скорости. Авторы отмечают, что новый подход может быть полезен в различных областях, включая обработку естественного языка и компьютерное зрение.

Работа опубликована на arXiv и доступна для скачивания. Исследователи планируют дальнейшее развитие метода, включая интеграцию с другими архитектурами и оптимизацию для специфических задач.