Исследователи представили X+Slides — специализированный бенчмарк для оценки того, насколько эффективно большие языковые модели адаптируют контент презентаций под конкретную аудиторию. Существующие инструменты автоматической генерации слайдов часто фокусируются лишь на полноте данных или технической сложности текста, игнорируя контекст восприятия информации конечным пользователем.

В рамках проекта протестирована способность моделей перерабатывать исходные документы с учетом различных запросов. Например, для технических специалистов система должна генерировать слайды с упором на строгие доказательства и детали, тогда как для руководителей и лиц, принимающих решения, приоритетом являются краткие выводы и прикладная значимость. Разработчики бенчмарка подчеркивают, что такой подход позволяет более точно измерять полезность ИИ-инструментов в реальных бизнес-сценариях.

Данная методология помогает выявить пробелы в текущих архитектурах LLM при работе со структурированными данными и их визуализацией. Использование X+Slides позволяет разработчикам точнее настраивать модели на соблюдение баланса между глубиной проработки материала и лаконичностью подачи, что является критическим фактором для автоматизации подготовки корпоративной отчетности и презентационных материалов.