Google и Microsoft совместно с рядом других технологических компаний представили инициативу по стандартизации отчетности о безопасности систем искусственного интеллекта. Новые спецификации призваны помочь разработчикам и владельцам ИИ-решений документировать процессы тестирования, оценки рисков и соблюдения этических норм. Документация описывает методы проверки моделей на предвзятость, устойчивость к взлому и соответствие заявленным параметрам безопасности.
Основная цель проекта — создание единого языка для прозрачности ИИ-систем, который позволит бизнесу и регуляторам объективно оценивать надежность внедряемых технологий. Стандарты включают протоколы для фиксации результатов «красных команд» (red teaming), где специалисты намеренно пытаются спровоцировать модель на некорректные ответы, а также требования к раскрытию данных, использованных при обучении и настройке безопасности.
Подобные спецификации призваны снизить неопределенность при интеграции ИИ в корпоративные процессы. Компании смогут использовать эти отчеты как доказательную базу при прохождении аудитов и взаимодействии с государственными органами. Инициатива направлена на формирование индустриального стандарта, который сделает процесс проверки безопасности ИИ-решений воспроизводимым и проверяемым для всех участников рынка.