Исследователи провели сравнительный анализ эффективности современных нейросетевых архитектур и классических статистических методов в задачах прогнозирования следующего действия (Next Activity Prediction). Несмотря на доминирование трансформеров и LLM, простые алгоритмы, такие как Argmax, демонстрируют сопоставимые или даже лучшие результаты в специфических бизнес-процессах, требующих высокой точности при ограниченных вычислительных ресурсах.
Работа ставит под сомнение необходимость повсеместного внедрения тяжеловесных моделей для задач предсказания последовательностей. Авторы показывают, что в сценариях с ограниченным объемом данных или жесткими требованиями к задержке (latency), традиционные подходы на базе LSTM или даже простые вероятностные методы могут быть эффективнее. Это открывает возможности для оптимизации пайплайнов обработки событий в реальном времени без потери качества предсказаний.
Исследование подчеркивает важность выбора архитектуры в зависимости от специфики данных. В то время как LLM показывают отличные результаты в задачах с контекстуальной зависимостью, для структурированных логов событий и бизнес-процессов с четкой логикой переходов более компактные модели обеспечивают лучший баланс между производительностью и стоимостью эксплуатации.
Ключевые факты
- Исследование сравнивает производительность Argmax, LSTM, трансформеров и LLM в задачах прогнозирования следующего действия.
- Выявлено, что в определенных бизнес-сценариях простые методы превосходят сложные архитектуры по точности и скорости.
- Работа анализирует влияние объема данных и сложности контекста на выбор оптимальной модели.
- Результаты указывают на возможность значительного снижения вычислительных затрат при использовании более легких моделей для предсказания событий.