Разработан инструмент для оценки совместимости локального оборудования с различными языковыми моделями. Сервис позволяет пользователям определить, хватит ли объема видеопамяти (VRAM) и оперативной памяти для запуска конкретной LLM с учетом различных уровней квантования.

Инструмент учитывает технические характеристики популярных графических ускорителей и требования моделей, представленных в форматах GGUF и других популярных архитектурах. Пользователь может выбрать модель, указать желаемый уровень сжатия параметров и получить расчет необходимого объема памяти для стабильной работы инференса.

Решение упрощает планирование инфраструктуры для тех, кто занимается локальным развертыванием нейросетей. Калькулятор помогает избежать ошибок при подборе железа, наглядно демонстрируя зависимость между размером модели, точностью вычислений и аппаратными ресурсами, необходимыми для эффективной работы агентных систем и локальных чат-ботов.