Google предупреждает о рисках безопасности для автономных ИИ-агентов, способных управлять компьютером и взаимодействовать с открытым вебом. Злоумышленники используют скрытые элементы на веб-страницах, чтобы манипулировать действиями моделей, таких как Gemini. Эти атаки направлены на обход инструкций безопасности и выполнение несанкционированных команд, что создает серьезные угрозы для пользователей, делегирующих агентам управление браузером и локальными файлами.
Основная проблема заключается в том, что агенты воспринимают визуальную и текстовую информацию на сайтах как доверенную. Хакеры внедряют невидимые для человека, но распознаваемые ИИ инструкции, которые заставляют модель выполнять действия, противоречащие её базовым настройкам. Это могут быть скрытые кнопки, команды в метаданных или специфическая разметка, провоцирующая агента на передачу данных или выполнение вредоносных скриптов.
Разработчики систем, использующих агентные возможности, сталкиваются с необходимостью внедрения новых уровней фильтрации контента. Традиционные методы защиты, основанные на проверке кода, оказываются недостаточными, так как атаки эксплуатируют именно логику принятия решений ИИ-моделью. Эксперты подчеркивают, что по мере расширения доступа агентов к операционным системам, подобные векторы атак будут становиться более изощренными и массовыми.
Ключевые факты
- Google официально подтвердила наличие векторов атак, использующих скрытые веб-элементы для манипуляции ИИ-агентами.
- Уязвимости позволяют злоумышленникам обходить системные промпты и заставлять агентов выполнять несанкционированные действия в браузере.
- Атаки эксплуатируют способность моделей интерпретировать визуальный контент и текстовую разметку как прямые инструкции к действию.
- Основной риск связан с предоставлением агентам прав на управление локальными файлами и учетными записями пользователей.
