Hacker News · 29.06.2026 ·Модели и релизы

DeepSeek анонсировала выпуск новой модели в середине июля

Китайская исследовательская лаборатория DeepSeek готовится к выпуску новой языковой модели, релиз которой запланирован на середину июля. Компания, известная своими достижениями в области эффективного обучения нейросетей и открытых архитектур, продолжает расширять линейку своих решений, претендуя на конкуренцию с ведущими мировыми разработчиками в сегменте высокопроизводительных LLM.

DeepSeek активно развивает направление открытых моделей, предоставляя сообществу доступ к весам и методологиям обучения. Предыдущие релизы лаборатории, такие как DeepSeek-V2, продемонстрировали высокую эффективность благодаря использованию архитектуры Mixture-of-Experts (MoE), что позволило значительно снизить затраты на инференс при сохранении качества ответов на уровне топовых проприетарных моделей.

Ожидаемый релиз может стать важным этапом в стратегии компании по укреплению позиций на глобальном рынке ИИ. Учитывая фокус DeepSeek на оптимизации вычислительных ресурсов, новая модель, вероятно, предложит улучшенные показатели производительности на единицу затрат, что критически важно для внедрения сложных агентных систем и масштабируемых корпоративных приложений.

Ключевые факты

Релиз новой модели DeepSeek намечен на середину июля.
Лаборатория специализируется на архитектурах Mixture-of-Experts (MoE) для оптимизации инференса.
Предыдущие версии моделей компании получили широкое признание за высокую эффективность обучения.
Разработки DeepSeek ориентированы на предоставление открытого доступа к весам моделей для исследовательских целей.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Рынок труда и экономика DeepSeek масштабирует команду на фоне успеха своих моделей Китайская исследовательская лаборатория DeepSeek объявила о масштабном наборе специалистов в свои офисы в Пекине и Шэньчжэне. Компания ищет экспертов в области глубокого обучения, инфраструктуры больших языковых моделей и прикладных исследований. Активный наем персонала свидетельствует о планах компании по дальнейшему развитию собственных архитектур и укреплению позиций на глобальном рынке ИИ-разработок. Hacker News · Модели и релизы DeepSeek представила мультимодальную модель с поддержкой зрения Компания DeepSeek расширила возможности своей платформы, добавив поддержку обработки визуальных данных. Теперь пользователи могут загружать изображения в чат-интерфейс для анализа, распознавания текста и интерпретации графических материалов. Обновление позволяет модели работать с визуальным контекстом наряду с текстовыми запросами, что приближает функциональность сервиса к актуальным стандартам ведущих мультимодальных систем. Hacker News · Исследования и наука Технологический прорыв DeepSeek в архитектуре нейросетей Китайская исследовательская лаборатория DeepSeek представила архитектуру, которая существенно меняет подход к обучению и работе крупных языковых моделей. В основе решения лежит использование архитектуры Mixture-of-Experts (MoE) с глубокой оптимизацией процесса активации параметров. Вместо того чтобы задействовать всю нейросеть целиком для каждого запроса, система активирует лишь малую часть весов, что позволяет радикально снизить вычислительные затраты при сохранении высокой точности ответов. Hacker News · Бизнес и инвестиции DeepSeek инвестирует 10 млрд долларов в развитие ИИ Китайская компания DeepSeek объявила о масштабной инвестиционной стратегии на сумму 10 миллиардов долларов. Эти средства будут направлены на развитие инфраструктуры, исследований и коммерциализации ИИ-технологий. В частности, компания планирует создать мощные вычислительные центры и расширить свои исследовательские лаборатории. Hacker News · Модели и релизы DeepSeek V4 Pro: мощь за пятую часть стоимости Claude Компания DeepSeek представила новую версию своей модели V4 Pro, которая по заявлениям разработчиков превосходит аналогичные решения, но при этом стоит в пять раз дешевле, чем аналогичный продукт от Claude. Это достижение стало возможным благодаря оптимизации архитектуры и использованию новых методов обучения, которые позволили значительно снизить затраты на вычислительные ресурсы. Hacker News · Бизнес и инвестиции DeepSeek привлекла $7 млрд при оценке в $50 млрд Китайский стартап DeepSeek, специализирующийся на разработке больших языковых моделей, привлек $7 млрд инвестиций при оценке в $50 млрд. Это один из крупнейших раундов финансирования в истории ИИ-индустрии, что подчеркивает растущий интерес к технологиям искусственного интеллекта в Азии. The Decoder · Бизнес и инвестиции DeepSeek привлекла $7,4 млрд при оценке в $50 млрд Китайский стартап DeepSeek, специализирующийся на разработке ИИ-моделей, привлек более 50 млрд юаней ($7,4 млрд) в рамках первого раунда внешнего финансирования. Это крупнейший раунд инвестиций в китайский ИИ-сектор за последние годы. GitHub · Инфраструктура для агентов DeepSpec: фреймворк от DeepSeek для оптимизации инференса через спекулятивное декодирование Компания DeepSeek представила DeepSpec — комплексную инфраструктуру для разработки, обучения и оценки алгоритмов спекулятивного декодирования. Инструментарий позволяет ускорить генерацию текста LLM за счет использования малых моделей-черновиков, которые предсказывают токены, а затем верифицируются основной моделью. Решение предоставляет полный стек для оптимизации инференса и повышения пропускной способности систем в реальном времени. Together.ai · Модели и релизы DeepSeek-V4 Pro доступна на Together AI Together AI анонсировала доступность модели DeepSeek-V4 Pro. Новая версия поддерживает контекст длиной 512K токенов, что позволяет обрабатывать сложные задачи, такие как анализ кода, документов и синтез исследований. Hacker News · ИИ в бизнесе Microsoft рассматривает DeepSeek для Copilot Cowork Microsoft ведёт переговоры о возможном использовании модели DeepSeek в своём сервисе Copilot Cowork. Это решение может значительно расширить возможности ИИ-ассистента, который уже интегрирован в продукты Microsoft 365.

← Все материалы