Hacker News · 05.07.2026 ·Инференс и железо

Meituan обучила модель на 1,6 трлн параметров без использования GPU Nvidia

Китайский технологический гигант Meituan успешно обучил масштабную модель с 1,6 трлн параметров, полностью отказавшись от использования графических процессоров Nvidia. Инженеры компании перестроили вычислительную инфраструктуру, сделав ставку на альтернативные аппаратные решения и оптимизацию распределенных вычислений, что позволило преодолеть ограничения, связанные с доступностью высокопроизводительных чипов на фоне экспортных ограничений.

Проект стал ответом на ужесточение санкций, ограничивающих поставки передовых ускорителей в Китай. Вместо стандартного стека на базе Nvidia, команда Meituan разработала собственные методы параллелизации и оптимизации передачи данных между узлами. Это позволило эффективно использовать гетерогенные вычислительные кластеры, состоящие из менее мощных или специализированных процессоров, обеспечив стабильное обучение модели такого колоссального размера.

Технический успех компании демонстрирует возможность масштабирования обучения LLM в условиях дефицита специализированного «железа». Опыт Meituan подчеркивает важность программной оптимизации: за счет глубокой настройки сетевых протоколов и управления памятью инженерам удалось минимизировать задержки, которые обычно возникают при использовании менее производительных вычислительных мощностей в крупных кластерах.

Ключевые факты

Модель содержит 1,6 трлн параметров, что сопоставимо с крупнейшими современными архитектурами.
Обучение проводилось без использования графических процессоров Nvidia, что стало ответом на экспортные ограничения США.
Инженеры внедрили кастомные методы распределенного обучения для работы на альтернативной аппаратной базе.
Проект подтверждает жизнеспособность стратегии масштабирования ИИ через программную оптимизацию при отсутствии доступа к топовым GPU.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

The Decoder · Инференс и железо Meituan обучила модель на 1,6 трлн параметров без использования чипов Nvidia Китайская технологическая компания Meituan представила модель LongCat-2.0, насчитывающую 1,6 триллиона параметров. Обучение системы было полностью проведено на вычислительных мощностях китайского производства, без использования графических процессоров Nvidia. Этот кейс демонстрирует возможность масштабирования обучения нейросетей в условиях экспортных ограничений на передовое западное оборудование, опираясь исключительно на внутреннюю инфраструктуру и локальные аппаратные решения. Hacker News · ИИ в бизнесе Китайский гигант Meituan обучил новую ИИ-модель на отечественных чипах Китайская технологическая компания Meituan представила новую языковую модель, процесс обучения которой был полностью реализован на чипах локального производства. Этот шаг демонстрирует способность крупных корпораций КНР адаптировать инфраструктуру для создания сложных ИИ-систем в условиях экспортных ограничений на передовое западное оборудование, обеспечивая технологическую независимость своих ключевых бизнес-процессов в сфере доставки и сервисов. Hacker News · Модели и релизы Китайская модель LongCat-2.0 обучена без использования чипов Nvidia Китайская исследовательская группа представила LongCat-2.0 — масштабную языковую модель, обучение которой прошло без использования графических процессоров Nvidia. Разработчики сфокусировались на оптимизации вычислительных процессов, что позволило достичь высокой производительности на альтернативном аппаратном обеспечении. Этот релиз демонстрирует возможность создания конкурентоспособных ИИ-систем в условиях экспортных ограничений на передовые западные чипы. Hacker News · Исследования и наука Технологический прорыв DeepSeek в архитектуре нейросетей Китайская исследовательская лаборатория DeepSeek представила архитектуру, которая существенно меняет подход к обучению и работе крупных языковых моделей. В основе решения лежит использование архитектуры Mixture-of-Experts (MoE) с глубокой оптимизацией процесса активации параметров. Вместо того чтобы задействовать всю нейросеть целиком для каждого запроса, система активирует лишь малую часть весов, что позволяет радикально снизить вычислительные затраты при сохранении высокой точности ответов. Hacker News · Модели и релизы Китайские ИИ-модели сокращают технологический разрыв с лидерами рынка Китайские разработчики ИИ значительно сократили отставание от ведущих западных лабораторий, таких как OpenAI и Anthropic. Новые модели из КНР демонстрируют результаты, сопоставимые с топовыми западными аналогами в тестах на логику, программирование и работу с текстом, что меняет глобальный ландшафт конкуренции в сфере генеративного искусственного интеллекта и ставит под вопрос технологическое доминирование США. Hacker News · Модели и релизы Cursor обучает модель с 1.5 триллионами параметров на 100 тысячах GPU Компания Cursor анонсировала обучение новой языковой модели с 1.5 триллионами параметров. Для этого процесса используется 100 тысяч графических процессоров, что делает этот проект одним из самых масштабных в области искусственного интеллекта. Engineering at Meta · Данные и инжиниринг Инфраструктура хранения данных для обучения масштабных ИИ-моделей от Meta Meta (признана экстремистской организацией, деятельность запрещена в РФ) представила архитектурный подход к организации систем хранения данных, необходимых для обучения моделей нового поколения. Компания оптимизировала пайплайны для работы с экспоненциально растущими датасетами, сократив время доступа к информации и снизив вычислительные издержки, что позволило ускорить цикл выпуска передовых моделей с нескольких месяцев до нескольких недель. Hacker News · Исследования и наука ByteDance представила новый закон масштабирования для обучения LLM Исследователи ByteDance разработали новый закон масштабирования, который позволяет более эффективно предсказывать производительность моделей при увеличении вычислительных мощностей. В отличие от традиционных подходов, новая методология учитывает специфику архитектурных параметров, что помогает оптимизировать процесс обучения и потенциально преодолеть замедление прогресса в развитии больших языковых моделей, сохраняя высокую эффективность при росте объемов данных. Hacker News · Инференс и железо Huawei адаптировала чипы Ascend для обучения моделей DeepSeek Китайская компания Huawei успешно адаптировала свои графические процессоры серии Ascend для обучения и дообучения передовых языковых моделей, включая архитектуру DeepSeek. Этот технологический сдвиг позволяет снизить зависимость от зарубежных аппаратных решений, которые ранее были основным стандартом для тренировки сложных нейросетей. Использование локальной инфраструктуры стало возможным благодаря оптимизации программного стека, который теперь обеспечивает стабильную работу с современными алгоритмами глубокого обучения. Hacker News · Обучение и дообучение Дообучение LLM на потребительском железе: практический гайд Разработчик успешно провел дообучение языковой модели на базе Apple Silicon, используя минимальные вычислительные ресурсы. Процесс занял около 15 минут и обошелся менее чем в один цент в пересчете на затраты электроэнергии. Этот кейс демонстрирует доступность локального дообучения моделей с использованием современных методов оптимизации, таких как QLoRA, на обычном персональном компьютере без необходимости аренды облачных GPU.

← Все материалы