Исследователи проанализировали применимость законов масштабирования (scaling laws) к задачам прогнозирования лимитных книг заявок (LOB). Изучив широкий спектр моделей — от простых деревьев решений до специализированных нейронных архитектур, таких как MLPLOB, — авторы установили, что зависимость между вычислительными затратами на инференс и точностью прогноза описывается степенным законом. Это позволяет оптимизировать архитектуры для высокочастотного трейдинга.
Работа фокусируется на поиске баланса между задержкой (latency) и предсказательной способностью моделей. В отличие от задач обработки естественного языка, где масштабирование параметров часто приводит к линейному росту вычислительных затрат, в финансовом прогнозировании критически важна эффективность «структурной прямой работы» (structural forward work). Авторы показывают, что выбор архитектуры напрямую влияет на положение модели на границе эффективности, позволяя достигать требуемой точности при минимальных временных задержках.
Данное исследование подтверждает, что принципы, лежащие в основе современных LLM, применимы и к узкоспециализированным финансовым временным рядам. Понимание этой границы позволяет инженерам выбирать оптимальную сложность модели в зависимости от жестких требований к скорости исполнения торговых операций, избегая избыточных вычислений без потери качества прогноза.
Ключевые факты
- Исследование опирается на бенчмарк FI-2010, ставший стандартом для оценки моделей прогнозирования биржевых стаканов.
- Установлено, что эмпирическая граница между вычислительными затратами и ошибкой прогноза подчиняется степенному закону.
- Архитектура MLPLOB выделена как наиболее эффективная в рамках протестированного семейства моделей.
- Результаты позволяют предсказывать производительность модели на основе объема вычислений, что критично для систем с низкой задержкой (low-latency trading).