Модели и релизы
Claude Fable 5: мощь и вызов для разработчиков
Simon Willison, известный разработчик и эксперт в области ИИ, поделился своими впечатлениями от новой модели Claude Fable 5, выпущенной компанией Anthropic. Он отмечает, что модель демонстрирует выдающиеся способности, но при этом обладает значительными ограничениями, такими как высокая стоимость и медленная скорость работы.
Anthropic представила Claude Fable 5 и Mythos 5
Anthropic анонсировала новые версии своих моделей — Claude Fable 5 и Mythos 5. Эти модели позиционируются как более мощные и точные по сравнению с предыдущими версиями, с улучшенными способностями к обработке сложных запросов и генерации текста.
Cohere представила North Mini Code — модель для разработчиков
Cohere, компания, специализирующаяся на разработке языковых моделей, представила новую модель North Mini Code. Это первая модель в линейке North, предназначенная специально для разработчиков. North Mini Code оптимизирована для работы с кодом и может использоваться в различных задачах, связанных с программированием, включая генерацию, рефакторинг и объяснение кода.
DeepMind представила Gemma 4 12B — универсальную мультимодальную модель
DeepMind анонсировала новую версию своей мультимодальной модели Gemma 4 12B. Это первая модель в линейке Gemma, которая работает без отдельного энкодера для текста и изображений, что делает её более универсальной и эффективной.
Локальный запуск Claude Design для создания UI-макетов
Разработчик JimLiu представил проект baoyu-design, позволяющий запускать Claude Design локально в качестве навыка для ИИ-агентов. Это решение даёт возможность создавать полированные UI-макеты, прототипы, презентации и wireframes в виде самостоятельных HTML-файлов, не прибегая к облачному сервису claude.ai/design.
Microsoft представил две новые модели ИИ MAI-Thinking-1 и MAI-Code-1-Flash
Microsoft объявил о выпуске двух новых текстовых моделей ИИ: MAI-Thinking-1 и MAI-Code-1-Flash. MAI-Thinking-1 — это модель для рассуждений с 1 триллионом параметров, из которых 35 миллиардов активны. Она доступна для "выбранных ранних партнеров". MAI-Code-1-Flash, с 137 миллиардами параметров и 5 миллиардами активных, специально разработана для GitHub Copilot и VS Code, чтобы обеспечить высокую производительность и низкую стоимость. Эта модель уже начинает выкатываться для индивидуальных пользователей GitHub Copilot в Visual Studio Code.
JoyAI-Echo: генерация длинных аудиовизуальных последовательностей
Команда JD AI представила JoyAI-Echo — фреймворк для генерации длинных аудиовизуальных последовательностей. Это решение позволяет создавать синхронизированные аудио- и видеоконтент, что может быть полезно для разработки ИИ-агентов, работающих с мультисенсорными данными.
Mellum2: новая 12-миллиардная модель от JetBrains для локального использования
JetBrains представила Mellum2 — новую 12-миллиардную модель, основанную на архитектуре Mixture-of-Experts (MoE). Эта модель разработана для эффективного локального использования, что делает её особенно интересной для разработчиков ИИ-агентов, которым важна производительность на локальных устройствах.
NVIDIA Cosmos 3 для разработки физических моделей ИИ
NVIDIA представила Cosmos 3 — фреймворк для создания физических моделей ИИ, которые могут понимать и взаимодействовать с реальным миром. Это особенно важно для роботов, автономных транспортных средств и умных пространств, где ИИ-агенты должны не только анализировать данные, но и принимать решения на основе физических закономерностей.
NVIDIA MCG Toolkit для автоматизации документации ИИ-моделей
NVIDIA представила MCG Toolkit — инструмент для автоматизации документации ИИ-моделей. Это особенно актуально на фоне ужесточения регуляторных требований, таких как California’s AB-2013 и EU AI Act, которые предъявляют строгие требования к прозрачности и отчетности моделей.
OlmoEarth v1.1: новые модели для анализа спутниковых данных
Allen Institute for AI представил обновлённую версию OlmoEarth v1.1 — семейство моделей для обработки и анализа спутниковых данных. Эти модели предназначены для работы с изображениями Земли, полученными с космических аппаратов, и могут использоваться в различных приложениях, включая мониторинг окружающей среды, сельское хозяйство и управление ресурсами.
DeepMind представила Gemini Omni
DeepMind анонсировала новую модель Gemini Omni, которая позиционируется как универсальное решение для широкого спектра задач. Gemini Omni отличается улучшенной производительностью и способностью работать с мультимодальными данными, включая текст, изображения и видео. Это важный шаг в развитии ИИ, так как модель демонстрирует высокий уровень адаптивности и точности в различных сценариях.
Gemini 3.5 от DeepMind: интеллект с возможностью действия
DeepMind представила новую модель Gemini 3.5, которая отличается от предыдущих версий способностью выполнять сложные, агентские рабочие процессы. Это значительный шаг вперёд, так как модель не только понимает контекст, но и может активно взаимодействовать с окружающей средой для достижения целей. Gemini 3.5 построена на архитектуре, которая позволяет ей интегрироваться с различными инструментами и системами, что делает её полезной для автоматизации сложных задач.
IBM Granite 4.1: новые модели для локального инференса
IBM представила обновлённые модели Granite 4.1, которые демонстрируют значительные улучшения в производительности и эффективности. Эти модели, доступные в различных размерах (7B, 13B, 34B и 115B параметров), оптимизированы для работы на локальных устройствах, что делает их особенно привлекательными для разработчиков ИИ-агентов, стремящихся к автономности и снижению затрат на облачные вычисления.
DeepSeek-V4 Pro доступна на Together AI
Together AI анонсировала доступность модели DeepSeek-V4 Pro. Новая версия поддерживает контекст длиной 512K токенов, что позволяет обрабатывать сложные задачи, такие как анализ кода, документов и синтез исследований.
NVIDIA Nemotron 3 Nano Omni: многомодальная модель для документов аудио и видео
NVIDIA представила новую модель Nemotron 3 Nano Omni, которая поддерживает работу с текстом, аудио и видео. Это важный шаг в развитии многомодальных моделей, которые могут обрабатывать различные типы данных. Модель поддерживает контекст длиной до 128K токенов, что позволяет обрабатывать большие документы и сложные запросы.
QIMMA: новый лидерборд для арабских языковых моделей
Команда из TII UAE представила QIMMA — первый лидерборд, ориентированный на качество арабских языковых моделей. В отличие от традиционных рейтингах, QIMMA фокусируется на оценке качества, а не на количестве параметров или производительности на общих бенчмарках.
Gemma 4: открытые модели для сложных агентских сценариев
DeepMind представила Gemma 4 — новую версию своих открытых моделей, позиционируемых как самые мощные на сегодняшний день. Эти модели специально оптимизированы для сложных задач, включая рассуждения и агентские workflows. Gemma 4 предлагает улучшенные возможности в обработке естественного языка, что делает её перспективной для интеграции в ИИ-агентов, требующих высокого уровня интеллектуальных способностей.
Gemini 3.1 Flash Live улучшает голосовые взаимодействия
DeepMind представила новую версию своей голосовой модели Gemini 3.1 Flash Live, которая обещает более естественные и точные голосовые взаимодействия. Новая модель фокусируется на снижении задержек и повышении точности, что делает её более подходящей для реального времени. Это важно для разработчиков ИИ-агентов, так как голосовые интерфейсы становятся всё более популярными в различных приложениях, от виртуальных ассистентов до клиентских сервисов.
TurboQuant: алгоритмы для сверхкомпактных моделей
Исследователи Google DeepMind представили TurboQuant — набор алгоритмов для экстремальной компрессии нейросетей. Технология позволяет сократить размер модели в 10–100 раз без потери точности, что критически важно для локального развёртывания ИИ-агентов.
Mistral Small 4: компактная модель с улучшенными характеристиками
Mistral представила новую версию своей компактной модели Mistral Small 4. Она поддерживает контекстное окно в 128K токенов, что позволяет обрабатывать более длинные тексты и сложные запросы. Новая модель демонстрирует улучшенные показатели в различных задачах, включая понимание естественного языка и генерацию текста.
Gemini 3.1 Flash-Lite от DeepMind: скорость и эффективность
DeepMind представила новую модель Gemini 3.1 Flash-Lite, которая позиционируется как самая быстрая и экономически выгодная в серии Gemini 3. Эта модель разработана для работы в условиях масштабируемой интеллектуальной обработки, что делает её особенно привлекательной для разработчиков ИИ-агентов и сервисов.
Gemini 3.1 Pro от DeepMind для сложных задач
DeepMind представила новую модель Gemini 3.1 Pro, ориентированную на решение сложных задач, где требуется не просто ответ, а глубокий анализ и понимание контекста. Модель демонстрирует улучшенные способности в обработке сложных запросов, что делает её перспективной для применения в различных областях, включая разработку ИИ-агентов.
Mistral представила модель Mistral 3 с 200+ миллиардами параметров
Mistral анонсировала новую модель Mistral 3, которая включает три версии: Mistral 3 12B, Mistral 3 44B и Mistral 3 200B. Все версии поддерживают работу с 128K контекстными окнами и доступны в режиме инференса на платформе Mistral AI.