Китайская технологическая компания Meituan представила модель LongCat-2.0, насчитывающую 1,6 триллиона параметров. Обучение системы было полностью проведено на вычислительных мощностях китайского производства, без использования графических процессоров Nvidia. Этот кейс демонстрирует возможность масштабирования обучения нейросетей в условиях экспортных ограничений на передовое западное оборудование, опираясь исключительно на внутреннюю инфраструктуру и локальные аппаратные решения.

Технический стек проекта базируется на оптимизированных кластерах, состоящих из китайских ускорителей, что является значимым сдвигом для индустрии. Разработчики сфокусировались на создании эффективных алгоритмов распределенного обучения, которые позволяют нивелировать разницу в производительности между проприетарными чипами и западными аналогами. Успех LongCat-2.0 подтверждает жизнеспособность стратегии импортозамещения в сегменте высокопроизводительных вычислений для обучения моделей уровня MoE (Mixture of Experts).

Данное достижение подчеркивает зрелость китайской экосистемы разработки ИИ, где программные оптимизации становятся ключевым фактором успеха при работе с ограниченным доступом к передовому «железу». Использование архитектуры, способной эффективно работать на альтернативных аппаратных платформах, открывает новые возможности для масштабирования крупных языковых моделей в регионах, находящихся под технологическими санкциями.

Ключевые факты

  • Модель LongCat-2.0 содержит 1,6 триллиона параметров, что ставит её в один ряд с крупнейшими мировыми разработками.
  • Процесс обучения был полностью реализован на китайских чипах, исключая использование оборудования Nvidia.
  • Проект доказывает эффективность программных методов оптимизации для преодоления аппаратных ограничений.
  • Meituan подтвердила возможность создания инфраструктуры для обучения сверхкрупных моделей без зависимости от западных поставщиков полупроводников.