The Decoder · 01.07.2026 ·Безопасность и алайнмент

Anthropic возобновила глобальный доступ к модели Fable 5 после двухнедельного запрета

Компания Anthropic возобновила глобальный доступ к модели Fable 5 после двухнедельного перерыва, вызванного правительственным запретом. Ограничения были введены из-за обнаруженной исследователями Amazon уязвимости типа «jailbreak». Для решения проблемы разработчики внедрили новый классификатор безопасности, который блокирует опасные запросы, однако это привело к росту числа ложноположительных срабатываний на безобидных пользовательских командах.

Инцидент подчеркнул сложность обеспечения безопасности в современных LLM. По заявлению Anthropic, выявленный метод обхода защиты применим не только к флагманским моделям, но и к более компактным версиям, таким как Claude Haiku 4.5. Это вынудило компанию пересмотреть подходы к фильтрации контента на уровне архитектуры модели, чтобы предотвратить эксплуатацию подобных уязвимостей в будущем.

Внедренный механизм защиты демонстрирует эффективность свыше 99% в предотвращении попыток взлома. Тем не менее, баланс между строгостью фильтрации и удобством использования остается критической задачей для разработчиков. Повышенная чувствительность классификатора теперь приводит к тому, что система чаще блокирует легитимные запросы, которые ошибочно интерпретируются как попытки обхода ограничений.

Ключевые факты

Запрет на использование модели Fable 5 действовал в течение двух недель по требованию правительства США.
Уязвимость была первоначально обнаружена исследователями из компании Amazon.
Новый классификатор безопасности блокирует более 99% попыток использования метода jailbreak.
Проблема эксплуатации защиты актуальна для всей линейки моделей, включая Claude Haiku 4.5.
Усиление мер безопасности привело к увеличению количества ложных срабатываний на безопасных запросах.

Источник: The Decoder

Обсудить с ИИ

Похожие материалы

AI News & Artificial Intelligence | TechCrunch · Регулирование и политика Правительство США ограничило выпуск моделей Anthropic из-за рисков безопасности Правительство США потребовало от компании Anthropic прекратить распространение новых моделей Fable 5 и Mythos 5. Решение принято после того, как исследователи из Amazon обнаружили уязвимости, позволяющие обходить встроенные механизмы защиты и ограничения безопасности в Fable 5. Власти обосновали запрет соображениями национальной безопасности, опасаясь потенциального злоупотребления возможностями ИИ. The Verge · Регулирование и политика Anthropic отключил доступ к Fable 5 и Mythos 5 по требованию правительства Anthropic, одна из ведущих компаний в области искусственного интеллекта, была вынуждена отключить доступ к своим моделям Fable 5 и Mythos 5 для всех пользователей, включая своих сотрудников. Это решение было принято в ответ на требование правительства США, которое сослалось на соображения национальной безопасности. Generative AI in Search Marketing: News & Expert Guides · Регулирование и политика Anthropic закрывает доступ к модели Fable 5 по требованию властей США Компания Anthropic прекратила работу модели Fable 5 в ответ на директиву правительства США об экспортном контроле. Решение было принято на фоне опасений регуляторов относительно безопасности технологии и потенциальных рисков, связанных с её использованием. Несмотря на то, что разработчик выразил несогласие с аргументами властей, доступ к системе был полностью ограничен для соблюдения федеральных требований. Hacker News · Модели и релизы Anthropic ограничивает доступ к Fable 5 и Mythos 5 для пользователей за пределами США Anthropic, один из ведущих разработчиков моделей искусственного интеллекта, объявил о временном ограничении доступа к своим последним моделям Fable 5 и Mythos 5 для пользователей за пределами Соединенных Штатов. Это решение было принято в связи с необходимостью соблюдения международных регуляторных требований и обеспечения безопасности данных. The Verge · Регулирование и политика Anthropic ограничила доступ к новым моделям из-за экспортного контроля Компания Anthropic была вынуждена временно приостановить доступ к своим новейшим моделям Fable 5 и Mythos 5 для широкого круга пользователей. Причиной стало внезапное распоряжение администрации США, связанное с ужесточением правил экспортного контроля в сфере технологий искусственного интеллекта. Требования регулятора распространяются не только на зарубежных клиентов, но и на иностранных граждан, находящихся на территории Соединенных Штатов, включая сотрудников самой компании. The Verge · Модели и релизы Anthropic возобновляет доступ к моделям Claude Fable 5 и Mythos Компания Anthropic объявила о возвращении доступа к своим моделям Claude Fable 5 и Mythos после успешных переговоров с Министерством торговли США. Ранее работа систем была приостановлена из-за введения экспортных ограничений. Восстановление функциональности начнется в ближайшее время, что позволит пользователям вновь использовать возможности данных моделей в своих рабочих процессах. The Verge · Регулирование и политика Anthropic блокирует доступ к новым моделям Fable 5 и Mythos 5 по требованию Белого дома Anthropic столкнулась с новым конфликтом с правительством США. После запуска моделей Fable 5 и Mythos 5, которые компания назвала самыми мощными на рынке, Белый дом потребовал ограничить доступ к ним для иностранных пользователей. Это требование было предъявлено всего через три дня после релиза моделей, 12 июня. Hacker News · Модели и релизы Anthropic планирует возобновить доступ к модели Claude Fable 5 Компания Anthropic готовится в ближайшие дни восстановить доступ к модели Claude Fable 5, работа которой была временно приостановлена. Руководство компании подтвердило, что технические специалисты занимаются устранением неполадок, возникших при эксплуатации системы, и ожидают скорого возвращения функционала в штатный режим. Simon Willison's Weblog · Модели и релизы Anthropic снимает экспортные ограничения на модели Claude Fable 5 и Mythos 5 Министерство торговли США официально отменило экспортные ограничения в отношении моделей Claude Fable 5 и Mythos 5, разработанных компанией Anthropic. В связи с этим разработчик объявил о поэтапном восстановлении доступа к данным инструментам для пользователей в регионах, ранее затронутых регуляторными запретами. Процесс возобновления работы сервисов начнется в ближайшие сутки. Hacker News · Безопасность и алайнмент Результаты ред-тиминга Claude Fable 5: уязвимости и риски Исследователи опубликовали отчет о ред-тиминге модели Claude Fable 5, проведенном до официального прекращения проекта. Анализ выявил критические уязвимости в системе безопасности, включая склонность модели к генерации вредоносного контента и обход защитных фильтров через сложные промпт-инъекции. Полученные данные подчеркивают сложность контроля поведения крупных языковых моделей в условиях непредсказуемых пользовательских запросов.

← Все материалы