arXiv · 26.06.2026 ·Исследования и наука

PAC-байесовские гарантии для управления замкнутыми системами

Исследователи представили новый метод получения теоретических гарантий для систем управления с обучением, использующих квадратичные функции потерь. Традиционные PAC-байесовские подходы сталкивались с трудностями из-за неограниченного характера таких функций, однако использование параметризации System Level Synthesis (SLS) позволило эффективно оценить поведение системы и обеспечить надежность предсказаний на ограниченных выборках данных.

Работа решает фундаментальную проблему в обучении с подкреплением и теории управления, где стандартные методы анализа часто оказываются неприменимы к нелипшицевым функциям стоимости. Авторы показывают, как переформулировка задачи через отображение траекторий замкнутого цикла позволяет обойти ограничения, связанные с зависимостью отклика системы от действий агента, и получить строгие вероятностные границы ошибки.

Этот подход открывает путь к созданию более безопасных и предсказуемых ИИ-систем в робототехнике и автономном управлении, где критически важно гарантировать стабильность работы алгоритма при ограниченном объеме обучающих данных. Метод позволяет формализовать риски, возникающие при использовании обучаемых моделей в контурах управления реального времени.

Ключевые факты

Разработан метод применения PAC-байесовских оценок для задач управления с квадратичной стоимостью.
Использована параметризация System Level Synthesis (SLS) для линеаризации отображения траекторий замкнутого цикла.
Метод преодолевает проблему неограниченных и нелипшицевых функций потерь, характерных для динамических систем.
Теоретические гарантии позволяют оценивать надежность моделей на основе конечных выборок данных, что критично для безопасности автономных систем.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

← Все материалы