Исследователи проанализировали эффективность различных подходов к работе с узкоспециализированными правовыми документами на примере закона Онтарио о жилой аренде (RTA). В рамках эксперимента сравнивались четыре стратегии: чистое дообучение (fine-tuning) моделей, использование систем поиска информации (RAG), комбинация этих методов и базовые модели без дополнительной подготовки. Целью работы было определить наиболее надежный способ получения точных ссылок на законодательные акты для арендаторов и арендодателей.

Результаты показывают, что выбор между дообучением и поисковой генерацией зависит от специфики задачи. В юридической сфере, где критически важна точность цитирования конкретных положений закона, гибридный подход демонстрирует преимущество перед использованием только дообученных моделей. Авторы отмечают, что дообучение помогает модели лучше понимать структуру правового языка, однако RAG остается необходимым инструментом для минимизации галлюцинаций при обращении к актуальным текстам нормативных актов.

Данное исследование подчеркивает важность выбора архитектуры для систем автоматизации в регулируемых отраслях. Использование только одного метода часто оказывается недостаточным для обеспечения высокой точности ответов. Комбинированные системы, сочетающие глубокое обучение на предметной области и динамический поиск по базе данных, показывают лучшие результаты в задачах, требующих строгой привязки к первоисточникам.