Исследователи представили GR2 — специализированную модель для этапа финального переранжирования в рекомендательных системах. Решение устраняет разрыв между возможностями больших языковых моделей и требованиями индустриальных систем, обеспечивая высокую точность при обработке каруселей и сеток контента. Модель оптимизирует вовлеченность пользователей, эффективно обрабатывая сложные контекстные зависимости, которые часто упускаются традиционными алгоритмами ранжирования.

Современные рекомендательные системы обычно работают по многоступенчатой схеме: отбор кандидатов, предварительное ранжирование и финальный этап. Именно последний шаг определяет, какой контент увидит пользователь в первую очередь. Использование LLM на этом этапе часто затруднено из-за высокой задержки, сложности учета контекста и нехватки специализированных архитектур, способных работать в режиме реального времени с огромными объемами данных.

GR2 предлагает архитектурные улучшения, которые позволяют интегрировать мощь генеративных моделей в пайплайны рекомендаций без потери производительности. Авторы сфокусировались на специфике отображения контента в интерфейсах, где порядок элементов критически влияет на кликабельность. Это позволяет компаниям точнее настраивать выдачу под индивидуальные предпочтения, сохраняя при этом низкие показатели latency, необходимые для работы с миллиардами пользователей.

Ключевые факты

  • GR2 оптимизирует финальный этап переранжирования в многоступенчатых рекомендательных воронках.
  • Модель специально адаптирована для форматов отображения контента «карусель» и «сетка».
  • Решение устраняет три критических разрыва, препятствующих внедрению LLM в индустриальные системы рекомендаций.
  • Архитектура сфокусирована на повышении метрик вовлеченности пользователей и downstream-производительности систем.