Исследователи проанализировали ограничения современных суррогатных моделей, используемых для климатического моделирования. Основная проблема заключается не только в архитектуре нейросетей, но и в качестве данных, на которых они обучаются. Традиционные наборы данных для климатических эмуляторов обладают низкой структурной вариативностью, что создает «потолок» для точности прогнозов даже при использовании сложных физически обоснованных моделей.
Авторы работы предлагают новый подход к проектированию сценариев обучения, который позволяет значительно расширить охват физических состояний системы. Увеличение разнообразия входных данных помогает моделям лучше обобщать закономерности и точнее предсказывать поведение климатических систем в условиях, выходящих за рамки стандартных исторических наблюдений. Это критически важно для создания надежных инструментов прогнозирования долгосрочных изменений окружающей среды.
Результаты исследования подчеркивают, что для повышения эффективности ИИ в физических науках необходимо сместить фокус с чисто архитектурных инноваций на методы генерации обучающих выборок. Систематический подход к дизайну сценариев позволяет преодолеть ограничения, связанные с нехваткой данных о редких или экстремальных климатических событиях, делая прогнозы более устойчивыми к неопределенности.