Исследователи представили новый подход к архитектуре нейронных сетей, основанный на использовании полиномиальных сетей Колмогорова-Арнольда (KAN). В работе анализируется проблема обучения нейросетей динамике «Игры жизни» Конвея — классического клеточного автомата, где стандартные архитектуры часто сталкиваются с трудностями при поиске оптимальных параметров. Авторы показывают, что выбор функции активации является критическим фактором, определяющим способность модели эффективно аппроксимировать правила системы.

Традиционные нейронные сети требуют значительного увеличения масштаба, чтобы случайно найти подсети с «удачной» инициализацией, способные воспроизвести правила автомата. Использование полиномиальных KAN позволяет существенно сократить этот разрыв. Благодаря замене фиксированных функций активации на обучаемые полиномиальные компоненты, модель получает возможность более гибко настраивать внутренние представления, что делает процесс обучения динамическим системам более стабильным и менее зависимым от случайных факторов при инициализации весов.

Данное исследование вносит вклад в понимание того, как архитектурные изменения влияют на обучаемость нейросетей в задачах с жесткими правилами и сложной пространственно-временной динамикой. Результаты показывают, что переход от стандартных MLP к архитектурам на базе KAN может стать эффективным инструментом для решения задач, где требуется точное моделирование алгоритмических процессов, а не просто статистическое приближение данных.