Исследователи из DeepSeek и других организаций представили новый подход к повышению точности небольших моделей кода без необходимости их переобучения. В работе рассматриваются так называемые «замороженные» модели кода (с параметрами ≤45 миллионов), которые не поддаются стандартным методам улучшения качества вывода.

Основное внимание уделено двум операторам, работающим на уровне выражения, а не семантического пространства. Первый оператор (M1) позволяет восстанавливать правильные программы, которые стандартные экстракторы отбрасывают. Этот метод не только не ухудшает качество (b10=0), но и полностью исключает утечку данных. Второй оператор помогает выравнивать сигнатуры тестов с публичными тестами, что также улучшает точность.

В результате применения этих операторов модель DeepSeek-Coder-1.3B показала улучшение на 12 задачах в наборе HumanEval+ (p=2.4e-4). Это значительный результат, учитывая, что модель не подвергалась дополнительному обучению. Подход может быть полезен для разработчиков ИИ-агентов, работающих с кодом, так как позволяет повысить точность без сложных и ресурсоемких процессов переобучения.

Авторы подчеркивают, что предложенные методы не только эффективны, но и безопасны, так как не требуют доступа к исходным данным. Это делает их особенно привлекательными для практического применения в различных сценариях, включая разработку ИИ-агентов, которые генерируют и оптимизируют код.