Модели и релизы

Thinking Machines Lab представила мультимодальную модель Inkling-Small MarkTechPost · 02.08.2026 Лаборатория Thinking Machines Lab выпустила Inkling-Small — мультимодальную модель с архитектурой Mixture-of-Experts (MoE). При общем объеме параметров в 276 млрд, модель задействует лишь 12 млрд активных параметров на токен. Разработка демонстрирует производительность, сопоставимую с оригинальной версией Inkling, при этом занимая в четыре раза меньше вычислительных ресурсов и памяти. Китайская модель Kimi K3 меняет ландшафт глобального рынка ИИ Hacker News · 02.08.2026 Китайский стартап Moonshot AI выпустил модель Kimi K3, которая стала значимым игроком на мировом рынке благодаря высокой производительности и бесплатной модели распространения. Продукт демонстрирует способность китайских разработчиков создавать конкурентоспособные LLM, способные обрабатывать огромные объемы контекста, что вынуждает западных технологических гигантов пересматривать свои стратегии ценообразования и доступности инструментов для пользователей. Claude Opus 5 генерирует полноценные 3D-игры по текстовому запросу The Decoder · 02.08.2026 Компания Anthropic представила модель Claude Opus 5, способную создавать функциональные 3D-игры на основе одного текстового промпта. Система генерирует геометрию, текстуры, физические свойства объектов и музыкальное сопровождение, которые исполняются непосредственно в браузере. В отличие от предыдущих итераций, модель перешла от создания примитивных цветовых блоков к разработке полноценных игровых прототипов с работающей механикой. Обзор ключевых ИИ-релизов и трендов лета 2026 года Simon Willison's Weblog · 02.08.2026 В августовском дайджесте Саймон Уиллисон представил обзор значимых событий в индустрии ИИ за июль 2026 года. Основное внимание уделено тестированию новых поколений моделей, включая GPT-5.6, Claude Opus 5, Kimi K3 и DeepSeek-V4-Flash-0731. Также обсуждаются риски непреднамеренных кибератак, спровоцированных действиями моделей OpenAI и Anthropic в ходе контролируемых испытаний. AMD представила открытую Mixture-of-Experts модель Instella-MoE-16B-A3B MarkTechPost · 01.08.2026 AMD выпустила Instella-MoE-16B-A3B — полностью открытую языковую модель с архитектурой Mixture-of-Experts, обученную с нуля на собственных ускорителях Instinct. Модель содержит 16 миллиардов параметров, однако для обработки каждого токена задействует лишь 2,8 миллиарда. Компания предоставила полный доступ к весам на всех этапах обучения, конфигурациям, наборам данных и коду для инференса. xAI представила модель генерации видео Grok-1.5 Vision Hacker News · 01.08.2026 Компания xAI анонсировала выход Grok-1.5 Vision — мультимодальной модели, способной обрабатывать и генерировать видеоконтент. Новая архитектура расширяет возможности текущей линейки Grok, позволяя системе анализировать визуальные данные в реальном времени и создавать видеоролики на основе текстовых запросов пользователей. Релиз направлен на усиление конкуренции в сегменте генеративного видео и глубокую интеграцию мультимодальности в экосистему платформы X. Новая невыпущенная модель OpenAI решила 10 сложных математических задач Hacker News · 01.08.2026 Неанонсированная модель OpenAI успешно справилась с 10 сложными математическими задачами, которые ранее считались трудноразрешимыми для нейросетей. Результаты демонстрируют значительный прогресс в способности ИИ к логическим рассуждениям и решению задач олимпиадного уровня, что подтверждает переход от простого предсказания следующего токена к более глубоким когнитивным процессам при обработке математических абстракций. ByteDance представила модель Seedance 2.5 для генерации 30-секундных видео со звуком The Decoder · 01.08.2026 ByteDance выпустила модель Seedance 2.5, способную генерировать видеоролики длительностью до 30 секунд с синхронизированным аудиорядом. Новинка позволяет использовать множественные референсы, включая изображения, видео и аудиофайлы. Инструмент ориентирован на ускорение производства рекламного контента, предлагая создание полноценных клипов за один цикл генерации, что значительно превосходит возможности многих существующих мультимодальных моделей по длительности вывода. Обзор возможностей модели DeepSeek-V4-Flash-0731 Hacker News · 01.08.2026 Саймон Уиллисон опубликовал подробный разбор новой модели DeepSeek-V4-Flash-0731, акцентируя внимание на её производительности и эффективности в задачах инференса. Модель демонстрирует значительный прогресс в скорости обработки запросов и качестве генерации кода, что делает её конкурентоспособным решением для разработчиков, стремящихся оптимизировать затраты на API при сохранении высокой точности ответов в сложных агентных сценариях. MiniMax представила мультимодальную модель H3 для генерации видео с аудио MarkTechPost · 01.08.2026 Китайский разработчик MiniMax выпустил модель H3 — универсальное мультимодальное решение, способное генерировать 15-секундные видеоролики в разрешении 2K с нативным стереозвуком. В отличие от узкоспециализированных инструментов, H3 обрабатывает текст, изображения, видео и аудио как единый контекст, что позволяет создавать видеоряд, синхронизированный с аудиодорожкой на уровне архитектуры модели. OpenAI разрабатывает семейство моделей Astra для долгосрочных агентных задач The Decoder · 01.08.2026 OpenAI работает над новым семейством моделей под кодовым названием Astra, ориентированным на выполнение сложных многоэтапных задач, требующих непрерывной работы в течение нескольких часов или дней. Проект нацелен на создание автономных систем, способных к глубокому планированию и длительному взаимодействию, что знаменует переход от разовых запросов к полноценным агентным процессам, способным решать комплексные проблемы без участия пользователя. Google прекращает поддержку моделей Gemini 2.5 Pro и Gemini 3 Flash Hacker News · 31.07.2026 Google официально объявила о выводе из эксплуатации моделей Gemini 2.5 Pro и Gemini 3 Flash. Разработчикам, использующим данные версии в своих проектах, необходимо перевести рабочие нагрузки на актуальные релизы API до установленного срока. Это стандартная процедура обновления инфраструктуры, направленная на оптимизацию вычислительных ресурсов и поддержку более производительных итераций нейросетевых архитектур компании. Thomson Reuters представила собственную специализированную LLM Hacker News · 31.07.2026 Медиахолдинг Thomson Reuters разработал собственную языковую модель, оптимизированную для работы с юридическими и налоговыми данными. Система показала высокую эффективность в профессиональных бенчмарках, сопоставимую с ведущими мировыми аналогами. Компания планирует интегрировать эту разработку в свои аналитические продукты, чтобы автоматизировать сложные процессы поиска и обработки специализированной документации для корпоративных клиентов. Обзор и интеграция открытой модели Kimi K3 Together.ai · 31.07.2026 Компания Moonshot AI представила Kimi K3 — первую открытую модель класса 3T (триллиона параметров). Релиз ориентирован на разработчиков, которым требуется высокая производительность при работе с большими объемами данных. Модель доступна через API платформы Together AI, что позволяет интегрировать её в существующие пайплайны с использованием стандартных инструментов для вызова LLM. Релиз DeepSeek-V4-Flash: новая модель с улучшенными агентными способностями Simon Willison's Weblog · 31.07.2026 Компания DeepSeek представила DeepSeek-V4-Flash-0731 — новую модель из серии V4, ориентированную на выполнение сложных агентных задач. При 304 миллиардах параметров модель демонстрирует высокую производительность, превосходя по ряду бенчмарков более крупные аналоги, такие как MiniMax M3. Эффективная архитектура и агрессивная ценовая политика делают её одним из самых конкурентоспособных решений на рынке LLM. DeepSeek обновила модель V4-Flash с улучшенными навыками программирования и агентности MarkTechPost · 31.07.2026 Компания DeepSeek выпустила обновленную версию модели DeepSeek-V4-Flash-0731, переведя API в стадию публичного бета-тестирования. Несмотря на сохранение прежней архитектуры и количества параметров, модель демонстрирует значительный прирост производительности в задачах написания кода и выполнения агентных сценариев. Улучшения достигнуты за счет повторного пост-обучения (re-post-training) существующего чекпоинта, что позволило повысить точность без изменения базовой структуры. Революция открытых весов: анализ влияния Kimi K3 и стратегии развития ИИ Simon Willison's Weblog · 31.07.2026 Саймон Уиллисон в подкасте Oxide and Friends обсудил текущий сдвиг в индустрии ИИ, вызванный появлением модели Kimi K3. Этот релиз доказал, что открытые веса способны конкурировать с проприетарными моделями фронтирного уровня. Эксперты проанализировали последствия этого прорыва для глобального технологического лидерства и вопросы безопасности, возникающие при массовом распространении мощных открытых систем. Google DeepMind представила Gemini Robotics 2 для управления роботами The Decoder · 31.07.2026 Google DeepMind анонсировала Gemini Robotics 2 — новую мультимодальную модель класса VLA (Vision-Language-Action), предназначенную для управления широким спектром робототехнических систем. Решение объединяет визуальное восприятие, понимание естественного языка и планирование действий, позволяя контролировать как компактные настольные манипуляторы, так и полноразмерных гуманоидных роботов, обеспечивая более высокий уровень автономности в выполнении сложных задач. Thinking Machines представила компактную модель Inkling Small The Decoder · 31.07.2026 Лаборатория Thinking Machines, основанная бывшим техническим директором OpenAI Мирой Мурати, выпустила Inkling Small. Эта модель с открытыми весами демонстрирует повышенную эффективность: при размере менее трети от оригинальной Inkling, новинка превосходит предшественницу в задачах на программирование и логические рассуждения, подтверждая тренд на оптимизацию архитектур вместо простого наращивания количества параметров. DeepSeek обновила модель V4 Flash: производительность на уровне лидеров при низкой цене The Decoder · 31.07.2026 Компания DeepSeek выпустила обновление «0731» для своей бюджетной модели V4 Flash, значительно повысив её вычислительные возможности. Согласно данным Artificial Analysis, модель набрала 50 баллов в Intelligence Index, вплотную приблизившись к показателям GPT-5.6 Luna от OpenAI. При этом стоимость выполнения задач с использованием новой версии снизилась примерно на 60% по сравнению с конкурентом. Voyage AI представила семейство моделей Voyage 4 с архитектурой MoE Hacker News · 31.07.2026 Компания Voyage AI анонсировала семейство моделей Voyage 4, ориентированных на задачи векторного поиска и семантического анализа. Новинка использует архитектуру Mixture-of-Experts (MoE) и обеспечивает единое пространство эмбеддингов для различных доменов. Модели показывают высокую точность в задачах RAG и классификации, предлагая баланс между вычислительной эффективностью и качеством представления данных в векторных базах. Релиз DeepSeek-V4-Flash-0731: новая итерация эффективной языковой модели Hacker News · 31.07.2026 Компания DeepSeek представила DeepSeek-V4-Flash-0731 — обновленную версию своей языковой модели, оптимизированную для высокой скорости работы и сниженных вычислительных затрат. Релиз ориентирован на задачи, требующие быстрого инференса при сохранении высокого качества генерации текста, что делает модель конкурентоспособным решением для масштабируемых агентных систем и приложений реального времени, работающих с большими объемами данных. Стартап Smallest.ai привлек $13 млн на разработку сверхбыстрых голосовых ИИ-моделей AI News & Artificial Intelligence | TechCrunch · 31.07.2026 Стартап Smallest.ai привлек $13 млн инвестиций для создания голосовых ИИ-моделей, ориентированных на сверхнизкую задержку и естественное звучание. Компания стремится преодолеть барьер «эффекта зловещей долины» в телефонных коммуникациях, создавая системы, способные имитировать человеческую речь с высокой точностью и минимальным временем отклика, что критически важно для прохождения теста Тьюринга в реальном времени. Анализ производительности и стоимости модели DeepSeek-V4-Flash Hacker News · 31.07.2026 Аналитическая платформа Artificial Analysis опубликовала детальный разбор новой модели DeepSeek-V4-Flash. Исследование подтверждает высокую эффективность архитектуры, демонстрируя значительный прогресс в соотношении вычислительной мощности и стоимости инференса. Модель показывает конкурентные результаты в бенчмарках, сохраняя при этом низкие задержки, что делает её привлекательным решением для высоконагруженных систем, требующих быстрой обработки данных при ограниченном бюджете на API.