Исследователи представили DSGNAR — фреймворк для оптимизации физически информированных нейронных сетей (PINN). Метод решает проблему плохой обусловленности ландшафта функции потерь, которая препятствует достижению точности классических численных методов при решении дифференциальных уравнений в частных производных. Алгоритм сочетает двойное скетчирование и адаптивное соотношение, обеспечивая масштабируемость и стабильность процесса обучения сложных физических моделей.
Физически информированные нейронные сети интегрируют законы физики непосредственно в архитектуру модели через функцию потерь, что позволяет им моделировать динамические системы на основе данных. Однако на практике обучение таких сетей часто сталкивается с «жесткими» задачами оптимизации, где градиенты становятся нестабильными, а сходимость замедляется. Традиционные оптимизаторы первого порядка, такие как Adam, часто не справляются с высокой кривизной ландшафта потерь, характерной для уравнений в частных производных.
Метод DSGNAR (Doubly-Sketched Gauss-Newton with Adaptive Ratio) использует аппроксимацию Гаусса-Ньютона, которая лучше учитывает геометрию функции потерь, чем стандартные методы градиентного спуска. За счет применения техник скетчирования исследователям удалось снизить вычислительную сложность метода, сохранив при этом высокую точность аппроксимации матрицы Гессе. Это позволяет применять алгоритм к задачам с большим количеством параметров, где классические методы второго порядка были бы слишком ресурсоемкими.
Ключевые факты
- DSGNAR предназначен для решения дифференциальных уравнений в частных производных с помощью нейросетей.
- Метод использует двойное скетчирование (doubly-sketched) для эффективной аппроксимации матрицы Гаусса-Ньютона.
- Алгоритм включает адаптивное соотношение (adaptive ratio) для динамической настройки параметров оптимизации в процессе обучения.
- Разработка направлена на преодоление ограничений по точности, которые ранее сдерживали применение PINN по сравнению с классическими вычислительными решателями.