MarkTechPost · 25.06.2026 ·Модели и релизы

Релиз Ornith-1.0: семейство моделей для кодинга с самообучаемыми RL-структурами

Компания DeepReinforce представила Ornith-1.0 — семейство открытых моделей для программирования, построенных на базе архитектур Gemma 4 и Qwen 3.5. Главной особенностью релиза стал отказ от фиксированных схем обучения с подкреплением (RL) в пользу динамических структур, которые модель формирует самостоятельно в процессе тренировки. Флагманская версия с 397 млрд параметров достигла показателя 82.4 на бенчмарке SWE-Bench Verified.

Традиционные подходы к обучению моделей для написания кода часто опираются на жестко заданные правила и внешние инструменты для проверки корректности кода. Ornith-1.0 меняет этот подход, позволяя нейросети самостоятельно выстраивать логику взаимодействия с окружением через механизмы обучения с подкреплением. Это позволяет модели эффективнее адаптироваться к сложным задачам разработки, требующим многошагового планирования и отладки.

Все веса моделей семейства Ornith-1.0 опубликованы под лицензией MIT, что делает их доступными для широкого использования в исследовательских и коммерческих целях. Интеграция передовых базовых архитектур с инновационным методом обучения позволяет этим моделям конкурировать с ведущими проприетарными решениями в задачах автоматизированного решения программных проблем.

Ключевые факты

Семейство Ornith-1.0 базируется на архитектурах Gemma 4 и Qwen 3.5.
Флагманская модель содержит 397 миллиардов параметров.
Результат на SWE-Bench Verified составляет 82.4 балла.
Все веса моделей распространяются по лицензии MIT.
Модели используют метод самостоятельного формирования RL-структур вместо использования фиксированных внешних инструментов.

Источник: MarkTechPost

Обсудить с ИИ

Похожие материалы

Hacker News · Инфраструктура для агентов Ornith-1.0: новый подход к самоорганизующемуся кодингу для ИИ-агентов Представлена модель Ornith-1.0, использующая метод самоорганизующихся лесов (self-scaffolding) для решения сложных задач программирования. В отличие от стандартных LLM, система динамически выстраивает структуру выполнения кода, разбивая задачи на подзадачи и самостоятельно управляя процессом их реализации. Это позволяет агентам эффективнее справляться с многоэтапной разработкой ПО, минимизируя ошибки в логике и структуре проекта. Hacker News · Модели и релизы Новая открытая модель GLM-5.2 превосходит проприетарные аналоги в задачах программирования Разработчики представили открытую языковую модель GLM-5.2, которая демонстрирует результаты в написании кода, превышающие показатели текущих флагманских решений от OpenAI. Согласно опубликованным бенчмаркам, модель показывает более высокую точность в решении алгоритмических задач и генерации функциональных скриптов, при этом стоимость её инференса составляет лишь 1/6 от затрат на использование закрытых моделей аналогичного класса. MarkTechPost · Обучение и дообучение Релиз prime-rl 0.6.0 для обучения масштабных MoE-моделей Компания Prime Intellect представила обновленный фреймворк prime-rl версии 0.6.0, предназначенный для асинхронного обучения с подкреплением (RL) на базе архитектур Mixture-of-Experts (MoE) с триллионными параметрами. Инструмент ориентирован на решение сложных агентных задач, требующих работы с длинными контекстами и высокой вычислительной эффективностью. В ходе тестирования система продемонстрировала возможность обучения модели GLM-5 с длиной последовательности до 131 тысячи токенов. Simon Willison's Weblog · Модели и релизы Выпущена открытая LLM GLM-5.2 с 753 миллиардами параметров Китайская лаборатория Z.ai представила модель GLM-5.2, которая на текущий момент претендует на звание самой мощной текстовой языковой модели с открытыми весами. Релиз состоялся спустя несколько дней после ограниченного доступа для подписчиков, и теперь веса модели доступны под лицензией MIT. Архитектура новинки основана на принципе Mixture of Experts (MoE), что позволяет эффективно использовать ресурсы при колоссальном объеме параметров. Hacker News · ИИ в бизнесе GitHub обновляет доступ к моделям в планах Free и Student GitHub расширил возможности для пользователей бесплатных и студенческих подписок Copilot, предоставив выбор между несколькими передовыми языковыми моделями. Теперь разработчики могут переключаться между Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и моделями семейства GPT-4o от OpenAI, что позволяет гибко подбирать инструмент под конкретные задачи программирования и архитектурные требования проекта. Hacker News · Оценка и бенчмарки Запущен интерактивный рейтинг популярных моделей с открытыми весами На платформе Hugging Face появился новый лидерборд, агрегирующий данные о популярности моделей с открытыми весами. Инструмент позволяет отслеживать востребованность различных LLM в режиме реального времени, опираясь на метрики сообщества и частоту использования. Ресурс помогает разработчикам и исследователям ориентироваться в быстрорастущем сегменте открытых языковых моделей и выбирать наиболее актуальные решения для своих задач. Hacker News · Модели и релизы GLM-5.2: открытые веса модели от Frontier Intelligence Компания Frontier Intelligence выпустила модель GLM-5.2 с открытыми весами. Это крупная языковая модель, доступная для загрузки и использования без ограничений. Hacker News · Модели и релизы Выход GLM-5.2: новая китайская модель для программирования Китайская компания Zhipu AI представила GLM-5.2 — новую версию большой языковой модели, ориентированную на решение задач по написанию и отладке программного кода. Разработчики сфокусировались на улучшении логических способностей модели, что позволило ей демонстрировать результаты, сопоставимые с ведущими западными аналогами в специализированных бенчмарках для разработчиков. Модель оптимизирована для интеграции в среды разработки и автоматизации написания сложных алгоритмических конструкций. AI | VentureBeat · Разработка и инструменты NousCoder-14B: открытая модель для кодинга от Nous Research Nous Research, стартап в области открытого ИИ, поддержанный венчурной фирмой Paradigm, представил новую модель для программирования NousCoder-14B. Модель была обучена всего за четыре дня на 48 графических процессорах Nvidia B200 и демонстрирует конкурентоспособные результаты с более крупными проприетарными системами. The Decoder · Модели и релизы Zhipu AI представила модель GLM-5.2 с контекстным окном в 1 млн токенов Китайская лаборатория Zhipu AI выпустила новую языковую модель GLM-5.2, распространяемую под лицензией MIT. Ключевой особенностью релиза стала поддержка контекстного окна объемом 1 миллион токенов, что позволяет обрабатывать значительные массивы данных за один запрос. Модель ориентирована на решение сложных задач, требующих длительного удержания контекста и глубокого анализа информации.

← Все материалы