Исследователи представили HiReLC — фреймворк для автоматизированной оптимизации глубоких нейронных сетей, объединяющий квантование и структурную обрезку (pruning). Система использует иерархическое обучение с подкреплением, разделяя задачу на уровни абстракции. Это позволяет эффективно подбирать конфигурации битности и параметры прореживания для каждого блока сети, минимизируя потери точности при значительном сокращении вычислительных затрат.
Метод декомпозирует процесс поиска оптимальной архитектуры на два уровня. Низкоуровневые агенты (LLA) работают независимо на уровне отдельных блоков, выбирая настройки для каждого ядра в многомерном пространстве действий. Высокоуровневый агент координирует работу LLA, обеспечивая глобальную оптимизацию всей модели. Такой подход позволяет адаптировать сжатие под конкретные аппаратные ограничения, не требуя ручного подбора гиперпараметров для каждого слоя.
Применение иерархической структуры решает проблему огромного пространства поиска, характерную для совместной оптимизации квантования и прунинга. Традиционные методы часто требуют значительных вычислительных ресурсов для поиска оптимальных параметров, тогда как HiReLC за счет распределенной агентной архитектуры ускоряет процесс и повышает качество итоговой сжатой модели.
Ключевые факты
- HiReLC использует иерархическую систему обучения с подкреплением для одновременного квантования и прунинга нейросетей.
- Низкоуровневые агенты (LLA) отвечают за выбор конфигураций на уровне отдельных блоков, работая в многомерном дискретном пространстве действий.
- Фреймворк автоматизирует подбор битности и коэффициентов обрезки, что снижает потребность в ручной настройке архитектуры.
- Метод направлен на создание компактных моделей, пригодных для развертывания на устройствах с ограниченными вычислительными мощностями.