arXiv · 18.06.2026 ·Оценка и бенчмарки

CRAX: новый высокопроизводительный бенчмарк для безопасного обучения с подкреплением

Исследователи представили CRAX — специализированный бенчмарк для оценки безопасности алгоритмов обучения с подкреплением (Reinforcement Learning, RL). Инструмент ориентирован на задачи, требующие высокой надежности, такие как промышленная робототехника и системы автономного вождения. Основная проблема существующих решений заключается в низкой скорости симуляции при работе с высокоточными 3D-физическими моделями, что замедляет процесс прототипирования и масштабных экспериментов.

CRAX оптимизирует вычислительные затраты, позволяя проводить тестирование алгоритмов с ограничениями (Constrained RL) значительно быстрее аналогов. Это достигается за счет более эффективной архитектуры среды, которая сохраняет физическую достоверность, но снижает нагрузку на аппаратное обеспечение. Такой подход дает возможность исследователям быстрее проверять гипотезы о поведении агентов в критических сценариях, где цена ошибки в реальном мире слишком высока.

Внедрение подобных инструментов критически важно для перехода от лабораторных тестов к внедрению автономных систем в реальные условия. Ускорение цикла итераций при разработке безопасных моделей позволяет быстрее выявлять уязвимости в логике принятия решений агентами и повышать общую устойчивость систем к нештатным ситуациям. Бенчмарк уже доступен для использования в академических и прикладных исследованиях, направленных на повышение безопасности ИИ-решений.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Машинное обучение Новый метод безопасного обучения с подкреплением для долгосрочных задач Исследователи представили новый подход к решению проблемы безопасного исследования в обучении с подкреплением (Reinforcement Learning). Основная сложность заключается в том, что агенты должны максимизировать производительность, строго соблюдая ограничения безопасности. В задачах с длинным горизонтом планирования текущие методы часто сталкиваются с накоплением ошибок оценки и ограниченными возможностями для поиска оптимальных стратегий, что делает их недостаточно надежными. Hugging Face - Blog · Оценка и бенчмарки VAKRA: новый бенчмарк для тестирования ИИ-агентов Исследователи из IBM Research представили VAKRA — новый бенчмарк для оценки способностей ИИ-агентов к логическому мышлению, использованию инструментов и обработке ошибок. В отличие от существующих тестов, VAKRA фокусируется на комплексных сценариях, требующих от агентов не только генерации текста, но и выполнения последовательных действий с анализом промежуточных результатов. MarkTechPost · Оценка и бенчмарки Skyfall AI представила MORPHEUS: бенчмарк для непрерывного обучения с подкреплением Компания Skyfall AI выпустила MORPHEUS — платформу для симуляции корпоративных сред, предназначенную для тестирования алгоритмов непрерывного обучения с подкреплением (Continual Reinforcement Learning). В отличие от классических тестов, система имитирует постоянно меняющиеся условия без сброса состояния, что требует от моделей адаптации к динамическим изменениям параметров среды в режиме реального времени. arXiv · Исследования и наука Новый метод направленных ограничений для безопасного обучения с подкреплением Исследователи представили метод Directional Constraints, повышающий эффективность обучения с подкреплением в робототехнике. Подход решает проблему баланса между безопасностью и скоростью исследования среды, позволяя агентам избегать опасных состояний без существенного замедления процесса обучения. Это критически важно для переноса навыков из симуляции в реальные физические условия, где цена ошибки при отработке движений крайне высока. arXiv · Оценка и бенчмарки Новый бенчмарк Adversarial Pragmatics для оценки безопасности LLM Исследователи представили бенчмарк Adversarial Pragmatics, предназначенный для глубокого анализа безопасности языковых моделей. В отличие от традиционных тестов, которые сводят результаты к бинарным оценкам «прошел/не прошел», этот инструмент фокусируется на сложных лингвистических сценариях: конфликтах инструкций, скрытых командах и двусмысленности политик безопасности. Это позволяет точнее выявлять причины сбоев в поведении моделей при выполнении агентных задач. arXiv · Исследования и наука CARLA-GS: новый метод генерации критических ситуаций для беспилотного транспорта Исследователи представили CARLA-GS — фреймворк для синтеза редких критических сценариев в симуляторах беспилотного вождения. Система разделяет визуальное представление, логическое рассуждение и физическое моделирование, что позволяет создавать фотореалистичные «corner cases» для тестирования безопасности. Подход значительно повышает эффективность обучения моделей управления, обеспечивая генерацию сложных дорожных ситуаций, которые трудно встретить в реальных данных при обычном вождении. The Decoder · Модели и релизы Microsoft представила специализированную модель MAI-Cyber-1-Flash для кибербезопасности Microsoft выпустила компактную языковую модель MAI-Cyber-1-Flash, предназначенную для задач кибербезопасности. Модель интегрирована в мультиагентную систему MDASH и демонстрирует высокую эффективность в автоматизированном анализе угроз. Использование специализированного решения позволяет компании снизить операционные расходы на 50%, перенаправляя на более мощные модели OpenAI только наиболее сложные и критические инциденты, требующие глубокого логического вывода. arXiv · Инфраструктура для агентов Cortex: новый фреймворк для управления робототехническими агентами Исследователи представили Cortex — фреймворк для воплощенных ИИ-агентов, решающий проблему выполнения долгосрочных задач в робототехнике. В отличие от стандартных VLA-моделей, ограниченных текущим наблюдением, Cortex использует двунаправленное выравнивание между высокоуровневым планированием и низкоуровневой кинематикой, что позволяет агентам эффективнее справляться со сложными манипуляциями в динамической среде. GitHub · Инфраструктура для агентов Представлен фреймворк AxisRL для обучения ИИ-агентов с подкреплением Команда XYZ-AI-Lab выпустила AxisRL — специализированный фреймворк для пост-тренировки ИИ-агентов с использованием обучения с подкреплением (RL). Решение объединяет возможности высокопроизводительного инференса SGLang, масштабируемые методы обучения Megatron и реальные сценарии взаимодействия агентов, позволяя оптимизировать модели для выполнения сложных многошаговых задач в динамических средах. MarkTechPost · Обучение и дообучение TRACE: система обучения ИИ-агентов через синтетические среды Исследователи из Стэнфорда представили TRACE — систему обучения ИИ-агентов, которая превращает повторяющиеся ошибки в специализированные тренировочные среды. Система анализирует траектории действий агента, выявляет пробелы в навыках, создает для них синтетические задачи с подкреплением и обучает отдельные LoRA-адаптеры. Это позволяет агентам динамически подключать нужные экспертные модули для решения сложных задач, значительно повышая точность выполнения операций.

← Все материалы