Разработчики представили SubQ — специализированную языковую модель, архитектура которой оптимизирована для обработки многомиллионных контекстных окон. В отличие от стандартных моделей, использующих квадратичную зависимость вычислительных затрат от длины входных данных, SubQ применяет сублинейные методы вычислений. Это позволяет значительно снизить потребление памяти и ускорить логические операции при анализе сверхдлинных документов, баз кода или массивов данных.

Технология ориентирована на задачи, требующие глубокого анализа контекста, который выходит за рамки возможностей большинства современных LLM. Архитектурные изменения позволяют модели удерживать внимание на всей последовательности токенов без критического замедления инференса. Такой подход решает проблему «забывания» информации в длинных текстах и повышает точность ответов при работе с большими объемами исходных материалов.

Решение направлено на устранение ограничений, связанных с масштабированием контекстного окна в текущих генеративных системах. Оптимизация вычислительных ресурсов при работе с миллионами токенов открывает новые возможности для автоматизации анализа технической документации, юридических архивов и сложных исследовательских отчетов, где критически важна целостность восприятия всей структуры данных.