Память и RAG
Как управлять гибридными командами из людей и ИИ-агентов
Согласно прогнозам, внедрение ИИ-агентов в предприятиях может вырасти на 300% в ближайшие два года. Это создаёт новые вызовы для руководства, которое должно адаптироваться к работе с гибридными командами, где люди и ИИ-агенты взаимодействуют на равных. В отличие от традиционных систем автоматизации, требующих ручного ввода, современные ИИ-агенты способны самостоятельно координировать сложные задачи и взаимодействовать с множеством инструментов и средами.
ИИ и Age of Empires II: что общего у моделей и стратегий
Исследователи из Университета Ватерлоо и Университета Торонто опубликовали работу, в которой сравнивают когнитивные способности больших языковых моделей (LLM) с навыками, демонстрируемыми игроками в стратегическую игру Age of Empires II. Авторы утверждают, что если LLM обладают человеко-подобными атрибутами, то аналогичные свойства можно обнаружить и в стратегиях, применяемых в этой игре.
Как Gemini Enterprise Agent Platform улучшает RAG для ИИ-агентов
Google представил Agentic RAG — подход к Retrieval-Augmented Generation (RAG) в рамках своей платформы Gemini Enterprise Agent. Этот метод направлен на повышение надёжности и точности ответов ИИ-агентов за счёт улучшенного извлечения и использования контекста из внешних источников.
ChatGPT добавляет память для лучшего контекста
OpenAI представила новую систему памяти для ChatGPT, названную Dreaming. Она позволяет чат-боту лучше запоминать предпочтения пользователей и поддерживать контекст в течение нескольких сессий. Это существенный шаг в развитии ИИ-агентов, так как память — ключевой компонент для создания более естественного и персонализированного взаимодействия.
MCP-инструменты для Reachy Mini интеграция восприятия в роботов
Команда Hugging Face анонсировала интеграцию MCP (Multimodal Control Protocol) в робота Reachy Mini. Это важный шаг для развития ИИ-агентов, так как MCP позволяет роботам воспринимать и взаимодействовать с окружающим миром через визуальные и тактильные данные.
Engram от Weaviate вышел в общий доступ
Weaviate анонсировала выход в общий доступ Engram — управляемой службы памяти и контекста для агентных приложений. Сервис позволяет разработчикам интегрировать долгосрочную память в ИИ-агенты, обеспечивая сохранение и обработку контекста между сессиями.
GitHub Copilot app: агентная среда на рабочем столе
GitHub представил обновлённое приложение Copilot, ориентированное на работу с ИИ-агентами. Новый интерфейс интегрирует агентов в привычную рабочую среду разработчика, позволяя использовать их для автоматизации задач, генерации кода и анализа данных.
Почему масштабируемая корпоративная ИИ-адоптация требует агентной логики
Исследователи из IBM Research в своем новом блоге на Hugging Face подчеркивают, что для успешного внедрения ИИ в корпоративные процессы недостаточно только языковых моделей (LLMs). Ключевым элементом становится агентная логика, которая позволяет моделям выполнять сложные задачи, требующие последовательных действий и взаимодействия с внешними системами.
Memory-OS: 7-уровневая система памяти для ИИ-агентов
Разработчик Claudio Drews представил Memory-OS — систему памяти для ИИ-агентов, работающую на базе Hermes Agent. Это решение предлагает 7 уровней памяти, включая постоянное хранение данных в Qdrant, структурированные факты, механизм fabric recall, автоматически обновляемую вики и точечную инъекцию контекста.
Как Braintrust использует Codex и GPT-5.5 для автоматизации разработки
Компания Braintrust, специализирующаяся на разработке программного обеспечения, делится своим опытом использования моделей Codex и GPT-5.5 для автоматизации процессов кодирования. Инженеры Braintrust применяют эти модели для быстрого выполнения экспериментов и ускорения разработки кода. Это позволяет значительно сократить время, затрачиваемое на рутинные задачи, и сосредоточиться на более сложных и творческих аспектах разработки.
Data Formulator 0.7: AI-агенты для аналитики корпоративных данных
Microsoft Research представила обновлённую версию Data Formulator 0.7, инструмента для AI-аналитики корпоративных данных. Платформа позволяет командам данных интегрировать большие объёмы данных в рабочую среду, где AI-агенты помогают исследовать, анализировать и визуализировать данные для получения практических выводов.
NVIDIA RTX: новые возможности для ИИ-персонажей и генерации кадров
NVIDIA представила обновления для своей платформы RTX, которые могут заинтересовать не только разработчиков игр, но и создателей ИИ-агентов. В частности, внимание привлекает DLSS 4.5 для Unreal Engine 5, который улучшает генерацию кадров и позволяет создавать более реалистичные визуальные эффекты. Это может быть полезно для разработчиков ИИ-агентов, работающих с визуальными данными и требующих высокой производительности.
SilverTorch: новый подход к рекомендательным системам
Meta (признана экстремистской организацией, деятельность запрещена в РФ) представила SilverTorch — новую архитектуру для рекомендательных систем. Она объединяет все компоненты извлечения контента пользователей в единую структуру. По заявлению компании, SilverTorch демонстрирует до 23,7 раза более высокую пропускную способность по сравнению с лучшими существующими решениями.
Weaviate MCP для поиска кода и документации
Weaviate представила решение для создания кодинг-ассистента на базе встроенного сервера MCP (Multi-Context Processing). Технология позволяет интегрировать ИИ-агентов Claude Code, Cursor и VS Code с базой кода и документации без написания дополнительного кода.
Новая семья реранкеров Ettin для RAG
Hugging Face представила новую семью реранкеров Ettin, специально разработанных для улучшения системы извлечения и генерации ответов (RAG). Эти модели предназначены для повышения качества поиска и ранжирования информации в больших наборах данных, что критически важно для эффективной работы ИИ-агентов.
PaddleOCR 3.5: интеграция с Transformers для обработки документов
Команда PaddlePaddle выпустила обновлённую версию PaddleOCR 3.5, которая теперь поддерживает интеграцию с библиотекой Transformers от Hugging Face. Это позволяет использовать модели OCR (оптическое распознавание символов) в рамках экосистемы Transformers, что упрощает их интеграцию в сложные ИИ-агенты и системы обработки документов.
Granite Embedding Multilingual R2: новые эмбеддинги для RAG
IBM представила Granite Embedding Multilingual R2 — набор мультиязычных эмбеддингов с контекстом до 32K токенов. Это открытая модель под лицензией Apache 2.0, которая демонстрирует лучшее качество ретриваля среди моделей с менее чем 100 миллионами параметров.
SocialReasoning-Bench: как ИИ-агенты действуют в интересах пользователей
Исследователи из Microsoft представили SocialReasoning-Bench — новый бенчмарк, который оценивает способность ИИ-агентов действовать в интересах пользователей. В ходе тестирования различных моделей выяснилось, что хотя агенты демонстрируют компетентность в выполнении задач, они не всегда способны улучшать положение пользователя, даже при явных инструкциях оптимизировать свои действия.
Как качество ретривала влияет на эффективность RAG-систем
Исследователи из Weaviate (разработчики векторной БД) опубликовали анализ, посвящённый роли ретривала в RAG-системах. Они утверждают, что даже самые мощные языковые модели не смогут давать качественные ответы, если ретривал не обеспечивает актуальные и релевантные данные.
DeepSeek-V4: миллион токенов для ИИ-агентов
Команда DeepSeek представила новую версию своей модели DeepSeek-V4, которая поддерживает контекст длиной в миллион токенов. Это значительный шаг вперёд для разработчиков ИИ-агентов, так как возможность работы с таким объёмом информации открывает новые горизонты для создания более сложных и автономных систем.
Weaviate 1.37: MCP-сервер и новые возможности для векторных баз данных
Weaviate выпустила версию 1.37, добавив несколько ключевых функций. В релизе появился встроенный MCP-сервер, который позволяет агентам взаимодействовать с внешними инструментами через API. Это упрощает интеграцию и расширяет возможности автоматизации задач.
ReasoningBank: как агенты учатся на опыте
Google Research представила ReasoningBank — фреймворк, который позволяет ИИ-агентам обучаться на основе собственного опыта. Это важный шаг в развитии автономных систем, способных адаптироваться к новым задачам без ручного программирования.
Weaviate представила Engram — облачную память для агентов
Weaviate анонсировала Engram — облачный сервис памяти для ИИ-агентов. Он позволяет агентам сохранять и обращаться к контексту, что критично для сложных задач, требующих долговременной памяти.
Как создавать синтетические датасеты для реального мира
Исследователи Google разработали методологию для создания синтетических датасетов, которые могут быть использованы в реальных сценариях. В статье подробно описан подход, основанный на механизмах проектирования и логическом выводе из первых принципов. Это позволяет генерировать данные, которые более точно отражают реальные условия и могут быть использованы для обучения и тестирования ИИ-моделей.