Исследователи проанализировали устойчивость LLM, используемых для автоматического отбора кандидатов, к промпт-инъекциям. Выяснилось, что добавление в резюме скрытых инструкций позволяет кандидатам манипулировать оценками алгоритмов, не меняя реальную квалификацию. Эксперименты подтвердили, что даже простые манипуляции текстом существенно искажают результаты ранжирования, что ставит под угрозу объективность автоматизированных HR-систем и требует внедрения новых методов защиты данных.
В ходе исследования модели тестировались в сценариях одиночных и множественных инъекций. Авторы использовали стратегии «саморекламы», где текст, не содержащий новых навыков, перехватывал управление логикой модели, заставляя её присваивать более высокие баллы. Это создает серьезный риск для компаний, полагающихся исключительно на ИИ при первичной фильтрации сотен откликов, так как система становится уязвимой к «хакингу» со стороны соискателей.
Результаты подчеркивают необходимость разработки специализированных фильтров для входящих документов и внедрения механизмов проверки целостности промптов в HR-инструментах. Без должного контроля автоматизация найма превращается в соревнование по написанию наиболее эффективных промпт-инъекций, что нивелирует ценность ИИ-аналитики и искажает процесс подбора персонала.
Ключевые факты
- Исследование сфокусировано на манипуляциях в автоматизированных системах скрининга резюме на базе LLM.
- Установлено, что добавление скрытых инструкций позволяет кандидатам повысить свой рейтинг без изменения фактического опыта.
- Эксперименты подтвердили эффективность как одиночных, так и каскадных (мульти-инъекционных) атак на логику оценки моделей.
- Выявлена критическая уязвимость алгоритмического найма к стратегическому манипулированию текстом со стороны пользователей.
- Работа указывает на необходимость внедрения систем защиты от инъекций в пайплайны обработки неструктурированных данных в HR-технологиях.