Исследователи проанализировали возможности компактных языковых моделей (SLM) в задачах извлечения отношений (Relation Extraction) из текстов. В фокусе внимания оказались модели с количеством параметров от 360 миллионов до 3 миллиардов. Результаты показывают, что такие системы способны демонстрировать производительность, сопоставимую с крупными моделями (LLM) уровня frontier, работая при этом в режиме zero-shot.

Эксперименты проводились на двух типах данных: текстах общего назначения и художественной литературе. Выяснилось, что при правильной настройке малые модели эффективно справляются с идентификацией связей между сущностями, не уступая по точности гораздо более тяжелым аналогам. Это открывает возможности для внедрения сложных NLP-решений в инфраструктуру с ограниченными вычислительными ресурсами.

Использование компактных моделей решает проблему зависимости от проприетарных API и позволяет развертывать системы обработки данных локально. Такой подход критически важен для сценариев, где предъявляются повышенные требования к конфиденциальности и скорости отклика. Исследование подтверждает, что эффективность извлечения информации зависит не только от масштаба модели, но и от оптимизации архитектуры под конкретные аналитические задачи.