Исследователи представили ZO-Act — метод дообучения больших языковых моделей с использованием оптимизации нулевого порядка. Технология позволяет обновлять веса моделей без классического обратного распространения ошибки, что критично при ограниченных ресурсах памяти. Метод ограничивает возмущения весов фиксированными подпространствами, основанными на активациях, что значительно снижает дисперсию оценок и повышает качество обучения по сравнению с традиционными подходами.

Традиционные методы оптимизации нулевого порядка часто полагаются на случайное построение низкоразмерных подпространств, что приводит к нестабильности и потере точности при масштабировании. ZO-Act решает эту проблему, используя информацию об активациях нейронной сети для более точного выбора направлений оптимизации. Это позволяет эффективно адаптировать модели в условиях, когда доступ к градиентам затруднен или требует чрезмерных вычислительных затрат.

Подход демонстрирует высокую эффективность в сценариях, где стандартное обучение становится невозможным из-за архитектурных ограничений или нехватки видеопамяти. Использование активаций для формирования подпространств позволяет сфокусировать процесс обучения на наиболее значимых параметрах, сокращая количество необходимых итераций и повышая общую сходимость алгоритма.

Ключевые факты

  • Метод ZO-Act использует активации модели для формирования низкоразмерных подпространств при оптимизации.
  • Технология исключает необходимость вычисления полных градиентов через обратное распространение ошибки.
  • Подход снижает дисперсию оценок, характерную для классических методов оптимизации нулевого порядка.
  • Метод оптимизирован для работы в условиях жестких ограничений по объему доступной памяти.