Kortex — это новый движок для выполнения больших языковых моделей, написанный с нуля на языке Rust. Его ключевая особенность заключается в реализации out-of-core инференса, что позволяет запускать модели, размер которых превышает объем доступной видеопамяти (VRAM), эффективно используя оперативную память системы для хранения весов и промежуточных вычислений в процессе генерации.

Архитектура движка ориентирована на оптимизацию работы с памятью при ограниченных аппаратных ресурсах. В отличие от стандартных решений, которые требуют полной загрузки весов модели в GPU, Kortex динамически управляет потоками данных между видеокартой и системной памятью. Это открывает возможности для запуска тяжелых LLM на потребительском оборудовании, где объем VRAM является критическим ограничением для работы современных архитектур.

Использование Rust обеспечивает высокий уровень безопасности памяти и производительность, сопоставимую с C++. Проект предоставляет низкоуровневый контроль над операциями инференса, что делает его подходящим инструментом для разработчиков, создающих локальные агентные системы или сервисы, требующие запуска моделей на железе с ограниченными ресурсами без потери качества генерации.

Ключевые факты

  • Реализован полностью на языке Rust для обеспечения безопасности и высокой производительности.
  • Поддерживает out-of-core инференс, позволяя запускать модели, превышающие объем видеопамяти.
  • Оптимизирован для работы с весами, которые не помещаются целиком в GPU, за счет эффективного управления системной памятью.
  • Проект доступен в открытом доступе на GitHub для интеграции в сторонние системы инференса.