Модели и релизы

Claude Fable 5: мощь и вызов для разработчиков Simon Willison's Weblog · 09.06.2026 Simon Willison, известный разработчик и эксперт в области ИИ, поделился своими впечатлениями от новой модели Claude Fable 5, выпущенной компанией Anthropic. Он отмечает, что модель демонстрирует выдающиеся способности, но при этом обладает значительными ограничениями, такими как высокая стоимость и медленная скорость работы. Anthropic представила Claude Fable 5 и Mythos 5 Lobsters · 09.06.2026 Anthropic анонсировала новые версии своих моделей — Claude Fable 5 и Mythos 5. Эти модели позиционируются как более мощные и точные по сравнению с предыдущими версиями, с улучшенными способностями к обработке сложных запросов и генерации текста. Cohere представила North Mini Code — модель для разработчиков Hugging Face - Blog · 09.06.2026 Cohere, компания, специализирующаяся на разработке языковых моделей, представила новую модель North Mini Code. Это первая модель в линейке North, предназначенная специально для разработчиков. North Mini Code оптимизирована для работы с кодом и может использоваться в различных задачах, связанных с программированием, включая генерацию, рефакторинг и объяснение кода. DeepMind представила Gemma 4 12B — универсальную мультимодальную модель Google DeepMind News · 09.06.2026 DeepMind анонсировала новую версию своей мультимодальной модели Gemma 4 12B. Это первая модель в линейке Gemma, которая работает без отдельного энкодера для текста и изображений, что делает её более универсальной и эффективной. Локальный запуск Claude Design для создания UI-макетов GitHub · 07.06.2026 Разработчик JimLiu представил проект baoyu-design, позволяющий запускать Claude Design локально в качестве навыка для ИИ-агентов. Это решение даёт возможность создавать полированные UI-макеты, прототипы, презентации и wireframes в виде самостоятельных HTML-файлов, не прибегая к облачному сервису claude.ai/design. Microsoft представил две новые модели ИИ MAI-Thinking-1 и MAI-Code-1-Flash Simon Willison's Weblog · 02.06.2026 Microsoft объявил о выпуске двух новых текстовых моделей ИИ: MAI-Thinking-1 и MAI-Code-1-Flash. MAI-Thinking-1 — это модель для рассуждений с 1 триллионом параметров, из которых 35 миллиардов активны. Она доступна для "выбранных ранних партнеров". MAI-Code-1-Flash, с 137 миллиардами параметров и 5 миллиардами активных, специально разработана для GitHub Copilot и VS Code, чтобы обеспечить высокую производительность и низкую стоимость. Эта модель уже начинает выкатываться для индивидуальных пользователей GitHub Copilot в Visual Studio Code. JoyAI-Echo: генерация длинных аудиовизуальных последовательностей GitHub · 02.06.2026 Команда JD AI представила JoyAI-Echo — фреймворк для генерации длинных аудиовизуальных последовательностей. Это решение позволяет создавать синхронизированные аудио- и видеоконтент, что может быть полезно для разработки ИИ-агентов, работающих с мультисенсорными данными. Mellum2: новая 12-миллиардная модель от JetBrains для локального использования Hugging Face - Blog · 01.06.2026 JetBrains представила Mellum2 — новую 12-миллиардную модель, основанную на архитектуре Mixture-of-Experts (MoE). Эта модель разработана для эффективного локального использования, что делает её особенно интересной для разработчиков ИИ-агентов, которым важна производительность на локальных устройствах. NVIDIA Cosmos 3 для разработки физических моделей ИИ NVIDIA Technical Blog · 01.06.2026 NVIDIA представила Cosmos 3 — фреймворк для создания физических моделей ИИ, которые могут понимать и взаимодействовать с реальным миром. Это особенно важно для роботов, автономных транспортных средств и умных пространств, где ИИ-агенты должны не только анализировать данные, но и принимать решения на основе физических закономерностей. NVIDIA MCG Toolkit для автоматизации документации ИИ-моделей NVIDIA Technical Blog · 29.05.2026 NVIDIA представила MCG Toolkit — инструмент для автоматизации документации ИИ-моделей. Это особенно актуально на фоне ужесточения регуляторных требований, таких как California’s AB-2013 и EU AI Act, которые предъявляют строгие требования к прозрачности и отчетности моделей. OlmoEarth v1.1: новые модели для анализа спутниковых данных Hugging Face - Blog · 19.05.2026 Allen Institute for AI представил обновлённую версию OlmoEarth v1.1 — семейство моделей для обработки и анализа спутниковых данных. Эти модели предназначены для работы с изображениями Земли, полученными с космических аппаратов, и могут использоваться в различных приложениях, включая мониторинг окружающей среды, сельское хозяйство и управление ресурсами. DeepMind представила Gemini Omni Google DeepMind News · 17.05.2026 DeepMind анонсировала новую модель Gemini Omni, которая позиционируется как универсальное решение для широкого спектра задач. Gemini Omni отличается улучшенной производительностью и способностью работать с мультимодальными данными, включая текст, изображения и видео. Это важный шаг в развитии ИИ, так как модель демонстрирует высокий уровень адаптивности и точности в различных сценариях. Gemini 3.5 от DeepMind: интеллект с возможностью действия Google DeepMind News · 15.05.2026 DeepMind представила новую модель Gemini 3.5, которая отличается от предыдущих версий способностью выполнять сложные, агентские рабочие процессы. Это значительный шаг вперёд, так как модель не только понимает контекст, но и может активно взаимодействовать с окружающей средой для достижения целей. Gemini 3.5 построена на архитектуре, которая позволяет ей интегрироваться с различными инструментами и системами, что делает её полезной для автоматизации сложных задач. IBM Granite 4.1: новые модели для локального инференса Hugging Face - Blog · 29.04.2026 IBM представила обновлённые модели Granite 4.1, которые демонстрируют значительные улучшения в производительности и эффективности. Эти модели, доступные в различных размерах (7B, 13B, 34B и 115B параметров), оптимизированы для работы на локальных устройствах, что делает их особенно привлекательными для разработчиков ИИ-агентов, стремящихся к автономности и снижению затрат на облачные вычисления. DeepSeek-V4 Pro доступна на Together AI Together.ai · 28.04.2026 Together AI анонсировала доступность модели DeepSeek-V4 Pro. Новая версия поддерживает контекст длиной 512K токенов, что позволяет обрабатывать сложные задачи, такие как анализ кода, документов и синтез исследований. NVIDIA Nemotron 3 Nano Omni: многомодальная модель для документов аудио и видео Hugging Face - Blog · 28.04.2026 NVIDIA представила новую модель Nemotron 3 Nano Omni, которая поддерживает работу с текстом, аудио и видео. Это важный шаг в развитии многомодальных моделей, которые могут обрабатывать различные типы данных. Модель поддерживает контекст длиной до 128K токенов, что позволяет обрабатывать большие документы и сложные запросы. QIMMA: новый лидерборд для арабских языковых моделей Hugging Face - Blog · 21.04.2026 Команда из TII UAE представила QIMMA — первый лидерборд, ориентированный на качество арабских языковых моделей. В отличие от традиционных рейтингах, QIMMA фокусируется на оценке качества, а не на количестве параметров или производительности на общих бенчмарках. Gemma 4: открытые модели для сложных агентских сценариев Google DeepMind News · 02.04.2026 DeepMind представила Gemma 4 — новую версию своих открытых моделей, позиционируемых как самые мощные на сегодняшний день. Эти модели специально оптимизированы для сложных задач, включая рассуждения и агентские workflows. Gemma 4 предлагает улучшенные возможности в обработке естественного языка, что делает её перспективной для интеграции в ИИ-агентов, требующих высокого уровня интеллектуальных способностей. Gemini 3.1 Flash Live улучшает голосовые взаимодействия Google DeepMind News · 26.03.2026 DeepMind представила новую версию своей голосовой модели Gemini 3.1 Flash Live, которая обещает более естественные и точные голосовые взаимодействия. Новая модель фокусируется на снижении задержек и повышении точности, что делает её более подходящей для реального времени. Это важно для разработчиков ИИ-агентов, так как голосовые интерфейсы становятся всё более популярными в различных приложениях, от виртуальных ассистентов до клиентских сервисов. TurboQuant: алгоритмы для сверхкомпактных моделей The latest research from Google · 24.03.2026 Исследователи Google DeepMind представили TurboQuant — набор алгоритмов для экстремальной компрессии нейросетей. Технология позволяет сократить размер модели в 10–100 раз без потери точности, что критически важно для локального развёртывания ИИ-агентов. Mistral Small 4: компактная модель с улучшенными характеристиками Mistral AI Blog · 16.03.2026 Mistral представила новую версию своей компактной модели Mistral Small 4. Она поддерживает контекстное окно в 128K токенов, что позволяет обрабатывать более длинные тексты и сложные запросы. Новая модель демонстрирует улучшенные показатели в различных задачах, включая понимание естественного языка и генерацию текста. Gemini 3.1 Flash-Lite от DeepMind: скорость и эффективность Google DeepMind News · 03.03.2026 DeepMind представила новую модель Gemini 3.1 Flash-Lite, которая позиционируется как самая быстрая и экономически выгодная в серии Gemini 3. Эта модель разработана для работы в условиях масштабируемой интеллектуальной обработки, что делает её особенно привлекательной для разработчиков ИИ-агентов и сервисов. Gemini 3.1 Pro от DeepMind для сложных задач Google DeepMind News · 19.02.2026 DeepMind представила новую модель Gemini 3.1 Pro, ориентированную на решение сложных задач, где требуется не просто ответ, а глубокий анализ и понимание контекста. Модель демонстрирует улучшенные способности в обработке сложных запросов, что делает её перспективной для применения в различных областях, включая разработку ИИ-агентов. Mistral представила модель Mistral 3 с 200+ миллиардами параметров Mistral AI Blog · 02.12.2025 Mistral анонсировала новую модель Mistral 3, которая включает три версии: Mistral 3 12B, Mistral 3 44B и Mistral 3 200B. Все версии поддерживают работу с 128K контекстными окнами и доступны в режиме инференса на платформе Mistral AI.