Память и RAG

936 эпизодов Lex Fridman в RAG с цитированием источников Hacker News · 15.06.2026 Разработчик Джонни Арана создал RAG-систему, которая индексирует 936 эпизодов подкаста Lex Fridman и позволяет пользователям получать ответы с точными ссылками на источники. Проект доступен на GitHub и может быть полезен для разработчиков ИИ-агентов, работающих с большими объемами текста и нуждающихся в точном цитировании источников. MDN MCP Server для управления памятью ИИ-агентов Hacker News · 15.06.2026 MDN (Mozilla Developer Network) представила MCP (Memory Control Plane) сервер — инструмент для управления памятью и контекстом в ИИ-агентах. MCP Server позволяет агентам эффективно хранить, обновлять и извлекать информацию, что критически важно для поддержания контекста в длительных диалогах или сложных задачах. Z.ai представила GLM-5.2 с контекстом в 1 млн токенов MarkTechPost · 15.06.2026 Z.ai анонсировала новую версию своей модели GLM-5.2, которая поддерживает контекстное окно в 1 миллион токенов. Это существенный шаг вперёд, так как большинство современных моделей ограничены контекстом в 128–256K токенов. Новая модель доступна во всех тарифах GLM Coding Plan и интегрирована в такие платформы, как Claude Code, Cline и OpenClaw через совместимый с Anthropic API. Как исправить амнезию ИИ систем Hacker News · 15.06.2026 ИИ-агенты часто сталкиваются с проблемой «амнезии» — они не могут сохранять и использовать контекст из предыдущих взаимодействий. Это существенный барьер для создания агентов, способных вести длительные и осмысленные диалоги. В статье на Medium автор Alan Ayala подробно разбирает различные подходы к решению этой проблемы. 21 год и восемь ловушек распределённых систем Hacker News · 15.06.2026 В 2025 году, через 21 год после публикации, статья о восьми ловушках распределённых систем остаётся актуальной. Эти принципы, сформулированные в 2004 году, описывают ключевые ошибки, которые допускают разработчики при проектировании распределённых систем. Для ИИ-агентов, таких как Jarv, понимание этих ловушек критически важно, так как агенты часто работают в распределённых средах, взаимодействуя с множеством сервисов и данных. Кодинг-агент с алгебраической памятью вместо RAG Hacker News · 14.06.2026 Разработчик Виталий Федотов представил проект Raidho — ИИ-агента, использующего векторно-символьное кодирование (VSA) вместо традиционного подхода RAG. VSA позволяет хранить и обрабатывать информацию в виде векторов, что может обеспечить более эффективное извлечение данных и контекстуальное понимание. Новый метод компактификации кэша ключ-значение для ИИ-агентов Hacker News · 14.06.2026 Исследователи представили новый метод компактификации кэша ключ-значение (KV), который может значительно улучшить производительность ИИ-агентов. В статье, опубликованной на arXiv, описывается подход Still, который выполняет компактификацию за один проход, что снижает накладные расходы и ускоряет работу систем с большими объёмами данных. CLI-агент с памятью и адаптивным поведением Hacker News · 14.06.2026 Команда Vektor Memory представила новую версию своего CLI-агента, который становится умнее с каждым использованием. Это достигнуто благодаря интеграции механизмов памяти и адаптивного обучения, что позволяет агенту запоминать контекст и улучшать свои ответы со временем. Гибкий слой управления для сохранения контекста ИИ-агентов Hacker News · 14.06.2026 Разработчики из команды vagnerfirminopro представили v-cos — фреймворк для управления состоянием ИИ-агентов, который позволяет сохранять контекст и логику работы между сессиями. Это особенно важно для агентов, которые выполняют сложные задачи, требующие долговременной памяти и согласованности действий. Hillock локальная память для ИИ-агентов на SQLite и HDC Hacker News · 14.06.2026 Разработчики из сообщества ИИ представили Hillock — локальную систему памяти для агентов, вдохновленную биологическими нейронами. Решение использует SQLite для хранения данных и алгоритмы HDC (Holographic Distributed Computing) для обработки информации. Это позволяет создавать более естественные и контекстуальные ответы, имитируя работу человеческого мозга. Nudge – коллаборативный слой памяти для Claude Code и Codex CLI Hacker News · 14.06.2026 Команда AttuneHQ представила Nudge – инструмент, который добавляет коллаборативный слой памяти для Claude Code и Codex CLI. Это решение позволяет сохранять и управлять контекстом взаимодействий с ИИ-агентами, что существенно улучшает их способность к долгосрочному запоминанию и контекстуальному пониманию. Рекурсивные языковые модели и нейросимволическое управление контекстом Hacker News · 14.06.2026 Исследователи предлагают новый подход к управлению контекстом в ИИ-агентах, сочетающий рекурсивные языковые модели и нейросимволические методы. Этот метод позволяет более эффективно обрабатывать и хранить информацию, что критически важно для построения сложных агентов. Исследование: семантический дрейф в PDF-документах Hacker News · 14.06.2026 Учёные из PQPDF провели масштабное исследование, проанализировав 24 824 PDF-документа с целью измерить семантический дрейф — явление, при котором один и тот же текст может иметь разные значения в зависимости от контекста и использования. Исследование показало, что даже в рамках одного документа могут существовать значительные вариации в интерпретации текста, что особенно важно для задач извлечения информации и построения RAG-систем. Ограничения доступа к знаниям после 12 июня Hacker News · 14.06.2026 12 июня 2024 года вступают в силу новые ограничения на доступ к знаниям, которые могут существенно повлиять на развитие ИИ. В частности, речь идёт о запрете на использование определённых данных для обучения моделей, что может привести к снижению качества и точности ИИ-систем. Hill charts с MCP-сервером для восприятия окружения Hacker News · 14.06.2026 Разработчики Hill charts представили интеграцию с MCP-сервером, что позволяет ИИ-агентам получать визуальную информацию о своём окружении. Это решение использует камеры и компьютерное зрение для создания интерактивных карт, которые помогают агентам ориентироваться в пространстве и взаимодействовать с объектами. NeuronDB: база данных для памяти LLM Hacker News · 14.06.2026 Разработчики из сообщества LLM представили NeuronDB — экспериментальную базу данных, предназначенную для хранения и управления памятью больших языковых моделей. Проект опубликован на GitHub и уже привлёк внимание сообщества, так как предлагает решение для одной из ключевых проблем в разработке ИИ-агентов — долгосрочной памяти. Lifting E-Graphs: новый подход к рефакторингу кода Hacker News · 14.06.2026 Исследователи представили концепцию Lifting E-Graphs, которая предлагает новый способ оптимизации и рефакторинга кода. Этот метод позволяет автоматически находить и применять оптимизации, которые вручную могли бы занять много времени и усилий. Lifting E-Graphs использует графы выражений (e-graphs) для представления и манипуляции кодом, что делает процесс рефакторинга более эффективным и менее подверженным ошибкам. Project Brain2.0: система памяти для ИИ-агентов на базе ClaudeCode Hacker News · 14.06.2026 Project Brain2.0 представляет собой фреймворк для создания и управления памятью ИИ-агентов. Он интегрируется с ClaudeCode и поддерживает работу с любыми агентами, способными читать файлы. Это решение позволяет агентам сохранять и извлекать информацию, что критически важно для построения контекста и поддержания состояния в длительных диалогах или задачах. Как наследуются «правдивые головы» в моделях для контекстуальной привязки arXiv · 14.06.2026 Исследователи изучили, как поведенческие свойства, такие как контекстуальная привязка, наследуются в моделях, созданных на основе общих базовых LLM. Они ввели метрику head-level context-truthfulness score, чтобы измерить, насколько точно модели сохраняют контекстуальную информацию при специализации. Это важно для разработки ИИ-агентов, так как позволяет предсказать, как поведение базовой модели повлияет на её специализированные версии. Память в ИИ для прогнозирования трафика arXiv · 14.06.2026 Исследователи из Университета Цинхуа и других ведущих вузов представили новый подход к прогнозированию состояния дорожного движения с использованием памяти. В статье, опубликованной на arXiv, они предлагают Memory-Augmented Graph Liquid Time-Constant Networks (M-GLTN) — модель, которая решает проблему нехватки данных в некоторых регионах за счёт переноса знаний из других областей. Использование Segment Anything Model для интерпретации сейсмических данных arXiv · 14.06.2026 Исследователи изучили применение Segment Anything Model (SAM) для интерпретации сейсмических данных, что может быть полезно для разработки ИИ-агентов, работающих с визуальной информацией. SAM, разработанный Meta, демонстрирует мощные возможности сегментации изображений на основе подсказок, что делает его перспективным инструментом для анализа сложных данных. Как RAG помогает бороться с галлюцинациями в мультимодальных моделях arXiv · 14.06.2026 Исследователи из MIT и других ведущих университетов предложили новый подход к снижению визуальных галлюцинаций в мультимодальных языковых моделях (MLLMs). Эти системы, способные обрабатывать как текстовые, так и визуальные данные, часто демонстрируют уверенность в своих ответах, даже когда визуальные данные слабые или неоднозначные. Это приводит к так называемым "галлюцинациям" — выводам, не соответствующим реальности. DYNA: динамическая память для ИИ-агентов на основе временных графов arXiv · 14.06.2026 Исследователи из MIT и других университетов предложили фреймворк DYNA, который решает проблему забывания знаний у больших языковых моделей (LLM). DYNA использует временной знаний граф, где события — это узлы, а временные отношения — направленные, временно помеченные рёбра. Этот граф служит внешней, обновляемой памятью, что позволяет LLM работать с новыми данными без переобучения. Проблема одинаковых фрингов в поиске решений для ИИ-агентов Hacker News · 14.06.2026 Исследование «The Same-Fringe Problem» рассматривает классическую проблему в поиске решений, когда два разных пути поиска приводят к одинаковым состояниям, что может привести к неэффективному использованию ресурсов. Это особенно актуально для ИИ-агентов, которые часто сталкиваются с необходимостью выбора оптимального пути в сложных задачах.