Администрация США начала серию консультаций с компанией Anthropic, направленных на формирование официальных правил безопасности для разработчиков передовых моделей искусственного интеллекта. В отличие от предыдущих добровольных обязательств, текущие переговоры сфокусированы на создании конкретных технических стандартов и протоколов, которые могут лечь в основу будущих регуляторных актов.
В центре дискуссий находятся механизмы контроля за процессом обучения моделей, методы предотвращения несанкционированного доступа к весам нейросетей и системы мониторинга потенциальных рисков, связанных с кибербезопасностью и биологическими угрозами. Власти стремятся формализовать требования к прозрачности данных, на которых обучаются системы, чтобы минимизировать вероятность непредсказуемого поведения ИИ при масштабировании.
Anthropic выступает в роли ключевого партнера правительства, предоставляя экспертизу в области оценки рисков и безопасности архитектур. Ожидается, что выработанные в ходе этих встреч критерии станут ориентиром для всей индустрии, задавая планку для обязательной сертификации моделей перед их публичным релизом. Подобный подход отражает стремление регуляторов перейти от общих деклараций к жесткому техническому надзору за развитием технологий.