Hacker News · 22.06.2026 ·Безопасность и алайнмент

Результаты тестирования ИИ-моделей Anthropic в закрытых системах АНБ

В ходе недавних испытаний по методу red-teaming модель Mythos от компании Anthropic продемонстрировала способность к обходу систем защиты, используемых Агентством национальной безопасности США. В рамках контролируемого эксперимента ИИ-система за несколько часов получила доступ к значительному объему классифицированных данных, имитируя действия злоумышленника внутри защищенного периметра. Эти результаты стали одним из ключевых факторов, повлиявших на решение правительства США ограничить доступ к наиболее мощным версиям моделей Anthropic для широкого круга пользователей.

Тестирование проводилось для оценки устойчивости критической инфраструктуры к атакам с применением генеративного ИИ. Модель показала высокую эффективность в поиске уязвимостей в конфигурациях безопасности и автоматизированном анализе сетевых протоколов. Специалисты отметили, что способность ИИ к автономному планированию многошаговых операций значительно повышает риски при работе с чувствительными данными, даже если доступ к ним ограничен строгими протоколами доступа.

Данный инцидент подчеркивает необходимость пересмотра стандартов безопасности для крупных языковых моделей, работающих с государственными и корпоративными данными повышенной секретности. Полученные данные легли в основу новых рекомендаций по внедрению эшелонированной защиты, которая учитывает возможности современных нейросетей по анализу кода и эксплуатации программных брешей в реальном времени. Anthropic продолжает сотрудничество с регуляторами для доработки механизмов контроля и обеспечения безопасности перед следующим этапом развертывания своих флагманских решений.

Источник: Hacker News

Похожие материалы

AI News & Artificial Intelligence | TechCrunch · Регулирование и политика Правительство отключило мощную модель Anthropic из-за рисков безопасности Anthropic столкнулась с серьёзными последствиями после обнаружения потенциальной уязвимости в своей модели. Компания выразила недовольство решением регуляторов, которые отозвали модель, развёрнутую для сотен миллионов пользователей. В блоге Anthropic подчеркнули, что риск связан с узкой уязвимостью, а не с системной проблемой. arXiv · Безопасность и алайнмент Исследование уязвимости моделей Anthropic к автоматическим атакам Учёные провели масштабное исследование устойчивости моделей Fable 5 и Opus 4.8 от Anthropic к автоматическим атакам. В ходе работы использовались четыре типа атак, направленных на 7 826 вредоносных намерений, охватывающих десять категорий потенциального вреда. Hacker News · Регулирование и политика Anthropic направила эксперта по безопасности ИИ в правительство США Anthropic отправила одного из своих ведущих специалистов по безопасности ИИ, Николаса Карлини, в правительство США. Его задача — помочь регуляторам лучше понять риски и возможности искусственного интеллекта. Карлини, известный своими исследованиями в области безопасности моделей большого языка, будет работать с правительственными чиновниками, чтобы разработать более эффективные подходы к регулированию ИИ. Hacker News · Безопасность и алайнмент Как ИИ влияет на уязвимости в программном обеспечении Исследование Anthropic изучает влияние языковых моделей на обнаружение и эксплуатацию уязвимостей в программном обеспечении. Учёные проанализировали, как ИИ может помочь в поиске и устранении уязвимостей, а также в создании эксплойтов. The Verge · Безопасность и алайнмент Китай мог получить доступ к Mythos от Anthropic Согласно новому отчету Semafor, Белый дом ввел экспортные ограничения на модель Mythos от Anthropic частично из-за опасений, что к ней мог получить доступ китайский кибергруппа. Если китайское правительство действительно имело доступ к Mythos 5 или Fable 5, это представляет серьезную угрозу национальной безопасности США. Hacker News · Регулирование и политика Белый дом и Anthropic переходят к разработке стандартов безопасности ИИ Администрация США начала серию консультаций с компанией Anthropic, направленных на формирование официальных правил безопасности для разработчиков передовых моделей искусственного интеллекта. В отличие от предыдущих добровольных обязательств, текущие переговоры сфокусированы на создании конкретных технических стандартов и протоколов, которые могут лечь в основу будущих регуляторных актов. Hacker News · Модели и релизы Anthropic ограничивает доступ к Fable 5 и Mythos 5 для пользователей за пределами США Anthropic, один из ведущих разработчиков моделей искусственного интеллекта, объявил о временном ограничении доступа к своим последним моделям Fable 5 и Mythos 5 для пользователей за пределами Соединенных Штатов. Это решение было принято в связи с необходимостью соблюдения международных регуляторных требований и обеспечения безопасности данных. Hacker News · Регулирование и политика Влияние риторики Anthropic на экспортные ограничения ИИ-технологий Компания Anthropic заняла более жесткую позицию в вопросах безопасности ИИ по сравнению с конкурентами, что, по мнению аналитиков, могло ускорить введение экспортных ограничений на передовые модели. Публичные заявления руководства компании о рисках неконтролируемого развития технологий способствовали формированию повестки в правительственных кругах США. В результате регуляторы получили дополнительные аргументы для ужесточения контроля над передачей технологий за рубеж. Hacker News · Бизнес и инвестиции Anthropic отключила Mythos после письма инвестора Anthropic временно отключила доступ к своей модели Mythos после того, как получила письмо от одного из инвесторов, Джоэла Лутника. В письме Лутник выразил обеспокоенность тем, что модель может быть использована для генерации дезинформации и манипуляций. AI News & Artificial Intelligence | TechCrunch · Регулирование и политика Правительство США ограничило выпуск моделей Anthropic из-за рисков безопасности Правительство США потребовало от компании Anthropic прекратить распространение новых моделей Fable 5 и Mythos 5. Решение принято после того, как исследователи из Amazon обнаружили уязвимости, позволяющие обходить встроенные механизмы защиты и ограничения безопасности в Fable 5. Власти обосновали запрет соображениями национальной безопасности, опасаясь потенциального злоупотребления возможностями ИИ.

← Все материалы