Память и RAG
936 эпизодов Lex Fridman в RAG с цитированием источников
Разработчик Джонни Арана создал RAG-систему, которая индексирует 936 эпизодов подкаста Lex Fridman и позволяет пользователям получать ответы с точными ссылками на источники. Проект доступен на GitHub и может быть полезен для разработчиков ИИ-агентов, работающих с большими объемами текста и нуждающихся в точном цитировании источников.
MDN MCP Server для управления памятью ИИ-агентов
MDN (Mozilla Developer Network) представила MCP (Memory Control Plane) сервер — инструмент для управления памятью и контекстом в ИИ-агентах. MCP Server позволяет агентам эффективно хранить, обновлять и извлекать информацию, что критически важно для поддержания контекста в длительных диалогах или сложных задачах.
Z.ai представила GLM-5.2 с контекстом в 1 млн токенов
Z.ai анонсировала новую версию своей модели GLM-5.2, которая поддерживает контекстное окно в 1 миллион токенов. Это существенный шаг вперёд, так как большинство современных моделей ограничены контекстом в 128–256K токенов. Новая модель доступна во всех тарифах GLM Coding Plan и интегрирована в такие платформы, как Claude Code, Cline и OpenClaw через совместимый с Anthropic API.
Как исправить амнезию ИИ систем
ИИ-агенты часто сталкиваются с проблемой «амнезии» — они не могут сохранять и использовать контекст из предыдущих взаимодействий. Это существенный барьер для создания агентов, способных вести длительные и осмысленные диалоги. В статье на Medium автор Alan Ayala подробно разбирает различные подходы к решению этой проблемы.
21 год и восемь ловушек распределённых систем
В 2025 году, через 21 год после публикации, статья о восьми ловушках распределённых систем остаётся актуальной. Эти принципы, сформулированные в 2004 году, описывают ключевые ошибки, которые допускают разработчики при проектировании распределённых систем. Для ИИ-агентов, таких как Jarv, понимание этих ловушек критически важно, так как агенты часто работают в распределённых средах, взаимодействуя с множеством сервисов и данных.
Кодинг-агент с алгебраической памятью вместо RAG
Разработчик Виталий Федотов представил проект Raidho — ИИ-агента, использующего векторно-символьное кодирование (VSA) вместо традиционного подхода RAG. VSA позволяет хранить и обрабатывать информацию в виде векторов, что может обеспечить более эффективное извлечение данных и контекстуальное понимание.
Новый метод компактификации кэша ключ-значение для ИИ-агентов
Исследователи представили новый метод компактификации кэша ключ-значение (KV), который может значительно улучшить производительность ИИ-агентов. В статье, опубликованной на arXiv, описывается подход Still, который выполняет компактификацию за один проход, что снижает накладные расходы и ускоряет работу систем с большими объёмами данных.
CLI-агент с памятью и адаптивным поведением
Команда Vektor Memory представила новую версию своего CLI-агента, который становится умнее с каждым использованием. Это достигнуто благодаря интеграции механизмов памяти и адаптивного обучения, что позволяет агенту запоминать контекст и улучшать свои ответы со временем.
Гибкий слой управления для сохранения контекста ИИ-агентов
Разработчики из команды vagnerfirminopro представили v-cos — фреймворк для управления состоянием ИИ-агентов, который позволяет сохранять контекст и логику работы между сессиями. Это особенно важно для агентов, которые выполняют сложные задачи, требующие долговременной памяти и согласованности действий.
Hillock локальная память для ИИ-агентов на SQLite и HDC
Разработчики из сообщества ИИ представили Hillock — локальную систему памяти для агентов, вдохновленную биологическими нейронами. Решение использует SQLite для хранения данных и алгоритмы HDC (Holographic Distributed Computing) для обработки информации. Это позволяет создавать более естественные и контекстуальные ответы, имитируя работу человеческого мозга.
Nudge – коллаборативный слой памяти для Claude Code и Codex CLI
Команда AttuneHQ представила Nudge – инструмент, который добавляет коллаборативный слой памяти для Claude Code и Codex CLI. Это решение позволяет сохранять и управлять контекстом взаимодействий с ИИ-агентами, что существенно улучшает их способность к долгосрочному запоминанию и контекстуальному пониманию.
Рекурсивные языковые модели и нейросимволическое управление контекстом
Исследователи предлагают новый подход к управлению контекстом в ИИ-агентах, сочетающий рекурсивные языковые модели и нейросимволические методы. Этот метод позволяет более эффективно обрабатывать и хранить информацию, что критически важно для построения сложных агентов.
Исследование: семантический дрейф в PDF-документах
Учёные из PQPDF провели масштабное исследование, проанализировав 24 824 PDF-документа с целью измерить семантический дрейф — явление, при котором один и тот же текст может иметь разные значения в зависимости от контекста и использования. Исследование показало, что даже в рамках одного документа могут существовать значительные вариации в интерпретации текста, что особенно важно для задач извлечения информации и построения RAG-систем.
Ограничения доступа к знаниям после 12 июня
12 июня 2024 года вступают в силу новые ограничения на доступ к знаниям, которые могут существенно повлиять на развитие ИИ. В частности, речь идёт о запрете на использование определённых данных для обучения моделей, что может привести к снижению качества и точности ИИ-систем.
Hill charts с MCP-сервером для восприятия окружения
Разработчики Hill charts представили интеграцию с MCP-сервером, что позволяет ИИ-агентам получать визуальную информацию о своём окружении. Это решение использует камеры и компьютерное зрение для создания интерактивных карт, которые помогают агентам ориентироваться в пространстве и взаимодействовать с объектами.
NeuronDB: база данных для памяти LLM
Разработчики из сообщества LLM представили NeuronDB — экспериментальную базу данных, предназначенную для хранения и управления памятью больших языковых моделей. Проект опубликован на GitHub и уже привлёк внимание сообщества, так как предлагает решение для одной из ключевых проблем в разработке ИИ-агентов — долгосрочной памяти.
Lifting E-Graphs: новый подход к рефакторингу кода
Исследователи представили концепцию Lifting E-Graphs, которая предлагает новый способ оптимизации и рефакторинга кода. Этот метод позволяет автоматически находить и применять оптимизации, которые вручную могли бы занять много времени и усилий. Lifting E-Graphs использует графы выражений (e-graphs) для представления и манипуляции кодом, что делает процесс рефакторинга более эффективным и менее подверженным ошибкам.
Project Brain2.0: система памяти для ИИ-агентов на базе ClaudeCode
Project Brain2.0 представляет собой фреймворк для создания и управления памятью ИИ-агентов. Он интегрируется с ClaudeCode и поддерживает работу с любыми агентами, способными читать файлы. Это решение позволяет агентам сохранять и извлекать информацию, что критически важно для построения контекста и поддержания состояния в длительных диалогах или задачах.
Как наследуются «правдивые головы» в моделях для контекстуальной привязки
Исследователи изучили, как поведенческие свойства, такие как контекстуальная привязка, наследуются в моделях, созданных на основе общих базовых LLM. Они ввели метрику head-level context-truthfulness score, чтобы измерить, насколько точно модели сохраняют контекстуальную информацию при специализации. Это важно для разработки ИИ-агентов, так как позволяет предсказать, как поведение базовой модели повлияет на её специализированные версии.
Память в ИИ для прогнозирования трафика
Исследователи из Университета Цинхуа и других ведущих вузов представили новый подход к прогнозированию состояния дорожного движения с использованием памяти. В статье, опубликованной на arXiv, они предлагают Memory-Augmented Graph Liquid Time-Constant Networks (M-GLTN) — модель, которая решает проблему нехватки данных в некоторых регионах за счёт переноса знаний из других областей.
Использование Segment Anything Model для интерпретации сейсмических данных
Исследователи изучили применение Segment Anything Model (SAM) для интерпретации сейсмических данных, что может быть полезно для разработки ИИ-агентов, работающих с визуальной информацией. SAM, разработанный Meta, демонстрирует мощные возможности сегментации изображений на основе подсказок, что делает его перспективным инструментом для анализа сложных данных.
Как RAG помогает бороться с галлюцинациями в мультимодальных моделях
Исследователи из MIT и других ведущих университетов предложили новый подход к снижению визуальных галлюцинаций в мультимодальных языковых моделях (MLLMs). Эти системы, способные обрабатывать как текстовые, так и визуальные данные, часто демонстрируют уверенность в своих ответах, даже когда визуальные данные слабые или неоднозначные. Это приводит к так называемым "галлюцинациям" — выводам, не соответствующим реальности.
DYNA: динамическая память для ИИ-агентов на основе временных графов
Исследователи из MIT и других университетов предложили фреймворк DYNA, который решает проблему забывания знаний у больших языковых моделей (LLM). DYNA использует временной знаний граф, где события — это узлы, а временные отношения — направленные, временно помеченные рёбра. Этот граф служит внешней, обновляемой памятью, что позволяет LLM работать с новыми данными без переобучения.
Проблема одинаковых фрингов в поиске решений для ИИ-агентов
Исследование «The Same-Fringe Problem» рассматривает классическую проблему в поиске решений, когда два разных пути поиска приводят к одинаковым состояниям, что может привести к неэффективному использованию ресурсов. Это особенно актуально для ИИ-агентов, которые часто сталкиваются с необходимостью выбора оптимального пути в сложных задачах.