Исследователи формализовали задачу Text2DSL, направленную на автоматическое создание кода для предметно-ориентированных языков (DSL) на основе естественного языка. В отличие от генерации SQL-запросов или кода общего назначения, работа с DSL требует учета специфических синтаксических правил и ограничений безопасности, что делает задачу более сложной и узкоспециализированной. Авторы подчеркивают, что ручное написание правил для управления политиками безопасности операционных систем часто приводит к ошибкам из-за высокого порога входа.

В рамках работы предложен подход, позволяющий LLM эффективно транслировать пользовательские описания в корректные DSL-инструкции. Это решение снижает зависимость от глубокой экспертизы разработчиков при настройке систем защиты. Метод опирается на специфические паттерны проектирования, которые помогают моделям лучше справляться с жесткими требованиями к синтаксису, характерными для языков управления доступом и конфигурациями безопасности.

Результаты исследования показывают, что специализированные методы генерации кода для DSL значительно повышают точность выполнения команд по сравнению с использованием стандартных моделей общего назначения. Данный подход открывает возможности для внедрения инструментов автоматизации в инфраструктурные задачи, где цена ошибки при написании кода критически высока, а сложность существующих языков конфигурации ограничивает скорость внедрения новых политик безопасности.