Исследователи изучили возможности применения больших языковых моделей для выявления телефонного мошенничества в турецком языке. В условиях дефицита размеченных данных для низкоресурсных языков авторы работы проанализировали эффективность аудио-анализа и текстовой обработки, предложив методы адаптации современных ИИ-систем для защиты уязвимых групп населения от киберпреступлений, которые ранее оставались вне фокуса глобальных технологических решений.
Традиционные системы защиты от мошенничества исторически ориентированы на английский и другие широко распространенные языки, что оставляет пользователей других регионов без адекватной технической поддержки. Работа фокусируется на преодолении барьера нехватки обучающих выборок, характерного для турецкого языка, и демонстрирует, как архитектуры LLM могут быть дообучены для распознавания паттернов социальной инженерии в аудиопотоках.
Авторы подчеркивают, что интеграция ИИ в системы фильтрации вызовов требует не только высокой точности распознавания речи, но и глубокого понимания контекстуальных нюансов мошеннических сценариев. Исследование предлагает методологию, позволяющую масштабировать подобные решения на другие языки с ограниченным доступом к качественным наборам данных, что является критически важным для глобальной безопасности коммуникаций.
Ключевые факты
- Исследование сфокусировано на детекции мошеннических звонков в турецком языке, который относится к категории низкоресурсных в контексте ИИ-обучения.
- Работа решает проблему нехватки размеченных данных, препятствующую созданию эффективных автоматизированных систем защиты.
- Предложенный подход опирается на возможности LLM для анализа аудио-контента и выявления признаков социальной инженерии.
- Методология направлена на устранение разрыва в технологической защищенности между пользователями английского языка и носителями других языковых групп.