Компания DeepSeek расширила возможности своей платформы, добавив поддержку обработки визуальных данных. Теперь пользователи могут загружать изображения в чат-интерфейс для анализа, распознавания текста и интерпретации графических материалов. Обновление позволяет модели работать с визуальным контекстом наряду с текстовыми запросами, что приближает функциональность сервиса к актуальным стандартам ведущих мультимодальных систем.

Интеграция зрения в DeepSeek открывает новые сценарии использования, включая автоматическое извлечение данных из документов, помощь в написании кода на основе скриншотов интерфейсов и анализ сложных диаграмм. Модель демонстрирует способность к точному описанию объектов и логическому выводу на основе предоставленных изображений, сохраняя при этом высокую скорость генерации ответов, характерную для предыдущих версий системы.

Данный релиз является частью стратегии компании по развитию универсальных ИИ-инструментов, способных обрабатывать разнородные типы данных. Внедрение визуальных возможностей в открытый доступ позволяет разработчикам и исследователям тестировать производительность модели в задачах компьютерного зрения и сравнивать её эффективность с существующими рыночными решениями в режиме реального времени.