Hacker News · 18.06.2026 ·Модели и релизы

DeepSeek представила мультимодальную модель с поддержкой зрения

Компания DeepSeek расширила возможности своей платформы, добавив поддержку обработки визуальных данных. Теперь пользователи могут загружать изображения в чат-интерфейс для анализа, распознавания текста и интерпретации графических материалов. Обновление позволяет модели работать с визуальным контекстом наряду с текстовыми запросами, что приближает функциональность сервиса к актуальным стандартам ведущих мультимодальных систем.

Интеграция зрения в DeepSeek открывает новые сценарии использования, включая автоматическое извлечение данных из документов, помощь в написании кода на основе скриншотов интерфейсов и анализ сложных диаграмм. Модель демонстрирует способность к точному описанию объектов и логическому выводу на основе предоставленных изображений, сохраняя при этом высокую скорость генерации ответов, характерную для предыдущих версий системы.

Данный релиз является частью стратегии компании по развитию универсальных ИИ-инструментов, способных обрабатывать разнородные типы данных. Внедрение визуальных возможностей в открытый доступ позволяет разработчикам и исследователям тестировать производительность модели в задачах компьютерного зрения и сравнивать её эффективность с существующими рыночными решениями в режиме реального времени.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Модели и релизы DeepSeek представила обновленную линейку моделей версии V3 Компания DeepSeek выпустила обновление своей флагманской архитектуры, продемонстрировав значительный прирост производительности в задачах кодинга, математики и логического вывода. Новые модели показывают улучшенные результаты на стандартных бенчмарках, подтверждая эффективность оптимизированных методов обучения и архитектурных доработок, направленных на повышение точности ответов при сохранении высокой скорости генерации текста и снижении вычислительных затрат. Hacker News · Модели и релизы Релиз DeepSeek-V3.2: обновление архитектуры и расширение возможностей модели Команда DeepSeek представила версию V3.2, продолжающую развитие линейки открытых языковых моделей. Обновление фокусируется на улучшении логических способностей, повышении точности при работе с кодом и оптимизации контекстного окна. Модель доступна для интеграции в прикладные системы, предлагая разработчикам более эффективный баланс между вычислительными затратами и качеством генерации ответов в задачах различной сложности. Hacker News · Модели и релизы DeepSeek представила новую архитектуру для эффективного обучения моделей Компания DeepSeek выпустила обновление, которое существенно меняет подход к обучению крупномасштабных языковых моделей. Разработчики представили архитектурные решения, позволяющие значительно сократить вычислительные затраты при сохранении высокой производительности. Новые методы оптимизации направлены на повышение эффективности работы с параметрами и ускорение процесса обучения, что делает передовые ИИ-технологии более доступными для широкого спектра задач. Hacker News · Модели и релизы DeepSeek анонсировала выпуск новой модели в середине июля Китайская исследовательская лаборатория DeepSeek готовится к выпуску новой языковой модели, релиз которой запланирован на середину июля. Компания, известная своими достижениями в области эффективного обучения нейросетей и открытых архитектур, продолжает расширять линейку своих решений, претендуя на конкуренцию с ведущими мировыми разработчиками в сегменте высокопроизводительных LLM. Together.ai · Модели и релизы DeepSeek-V4 Pro доступна на Together AI Together AI анонсировала доступность модели DeepSeek-V4 Pro. Новая версия поддерживает контекст длиной 512K токенов, что позволяет обрабатывать сложные задачи, такие как анализ кода, документов и синтез исследований. Hacker News · Модели и релизы Релиз DeepSeek-V4-Flash-0731: новая итерация эффективной языковой модели Компания DeepSeek представила DeepSeek-V4-Flash-0731 — обновленную версию своей языковой модели, оптимизированную для высокой скорости работы и сниженных вычислительных затрат. Релиз ориентирован на задачи, требующие быстрого инференса при сохранении высокого качества генерации текста, что делает модель конкурентоспособным решением для масштабируемых агентных систем и приложений реального времени, работающих с большими объемами данных. Hugging Face - Blog · Память и RAG DeepSeek-V4: миллион токенов для ИИ-агентов Команда DeepSeek представила новую версию своей модели DeepSeek-V4, которая поддерживает контекст длиной в миллион токенов. Это значительный шаг вперёд для разработчиков ИИ-агентов, так как возможность работы с таким объёмом информации открывает новые горизонты для создания более сложных и автономных систем. The Decoder · Модели и релизы DeepSeek обновила модель V4 Flash: производительность на уровне лидеров при низкой цене Компания DeepSeek выпустила обновление «0731» для своей бюджетной модели V4 Flash, значительно повысив её вычислительные возможности. Согласно данным Artificial Analysis, модель набрала 50 баллов в Intelligence Index, вплотную приблизившись к показателям GPT-5.6 Luna от OpenAI. При этом стоимость выполнения задач с использованием новой версии снизилась примерно на 60% по сравнению с конкурентом. Hacker News · Бизнес и инвестиции DeepSeek инвестирует 10 млрд долларов в развитие ИИ Китайская компания DeepSeek объявила о масштабной инвестиционной стратегии на сумму 10 миллиардов долларов. Эти средства будут направлены на развитие инфраструктуры, исследований и коммерциализации ИИ-технологий. В частности, компания планирует создать мощные вычислительные центры и расширить свои исследовательские лаборатории. Hacker News · Модели и релизы DeepSeek V4 Pro: мощь за пятую часть стоимости Claude Компания DeepSeek представила новую версию своей модели V4 Pro, которая по заявлениям разработчиков превосходит аналогичные решения, но при этом стоит в пять раз дешевле, чем аналогичный продукт от Claude. Это достижение стало возможным благодаря оптимизации архитектуры и использованию новых методов обучения, которые позволили значительно снизить затраты на вычислительные ресурсы.

← Все материалы