arXiv · 28.06.2026 ·Память и RAG

GeoRAG: новый подход к оптимизации контекста в RAG-системах

Исследователи представили GeoRAG — метод оптимизации выбора контекста для RAG-систем, решающий проблему неполного охвата информации при сложных запросах. Вместо стандартного ранжирования чанков по близости к одному эмбеддингу, система переосмысливает поиск как задачу покрытия информационных потребностей. Это позволяет эффективно обрабатывать многоходовые и неоднозначные вопросы, избегая избыточности и потери важных деталей.

Традиционные RAG-архитектуры при выборе top-k чанков часто фокусируются на одном семантическом аспекте запроса. В результате модель получает много дублирующей информации, но упускает критически важные подвопросы, необходимые для формирования точного ответа. GeoRAG переводит процесс из плоскости простого поиска в плоскость покрытия семантического пространства, что значительно повышает качество генерации в сложных сценариях.

Подход позволяет динамически распределять внимание системы на различные аспекты запроса, обеспечивая более полное покрытие данных. Это особенно актуально для корпоративных баз знаний и аналитических систем, где ответы требуют синтеза информации из разрозненных источников, которые стандартные векторные методы часто игнорируют из-за их тематической удаленности от основного вектора запроса.

Ключевые факты

GeoRAG заменяет классическое ранжирование чанков на оптимизацию покрытия информационных потребностей.
Метод направлен на решение проблем «зацикливания» на одном семантическом аспекте при многоходовых запросах.
Технология минимизирует избыточность контекста, исключая дублирующую информацию в рамках top-k выборки.
Подход улучшает точность ответов на сложные и неоднозначные вопросы за счет учета скрытых подвопросов.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

Hacker News · Память и RAG Новый метод RAG от Emory и IBM повышает точность до 97% при снижении затрат токенов Исследователи из Университета Эмори и IBM представили метод управляемого поиска (Governed AI retrieval), который значительно оптимизирует работу RAG-систем. Технология позволяет достичь 97% точности ответов, сокращая при этом расход токенов на 67%. Подход фокусируется на строгом контроле контекста, что минимизирует галлюцинации и повышает эффективность обработки данных в корпоративных ИИ-решениях. Hacker News · Память и RAG Почему одной памяти недостаточно: управление контекстом в ИИ-агентах Для создания эффективных ИИ-агентов простой реализации памяти недостаточно. Разработчики сталкиваются с проблемой «зашумления» контекста, когда избыточная информация снижает точность ответов модели. Статья объясняет, почему управление контекстом — фильтрация, приоритизация и структурирование данных — становится критическим этапом в архитектуре агентных систем, позволяя моделям фокусироваться на актуальных задачах и избегать галлюцинаций при работе с большими массивами данных. Hacker News · Память и RAG Инструмент для поиска уязвимых мест в RAG-системах Разработчики представили инструмент ragProbe, предназначенный для автоматизированного тестирования систем с дополненной генерацией (RAG). Решение помогает выявлять запросы, на которых текущий пайплайн поиска и генерации выдает неточные или ошибочные ответы, еще до этапа эксплуатации продукта конечными пользователями. Hacker News · Инфраструктура для агентов Субмодулярный отбор контекста для оптимизации работы LLM-агентов Исследователи представили метод субмодулярного отбора контекста, который позволяет динамически выбирать наиболее релевантную информацию для LLM-агентов. Этот подход выступает в роли подключаемого модуля, оптимизирующего подачу данных в контекстное окно. Технология позволяет агентам эффективнее обрабатывать длинные последовательности, снижая количество избыточных токенов и повышая точность ответов при работе со сложными задачами. arXiv · Память и RAG Как RAG помогает ИИ-агентам решать сложные задачи через аналогии Исследователи из MIT и Google Research предложили новый подход к улучшению способности языковых моделей решать сложные задачи через аналогии. В работе, опубликованной на arXiv, они демонстрируют, как Retrieval-Augmented Generation (RAG) может быть адаптирован для более эффективного решения задач, требующих нестандартного мышления. Hacker News · Память и RAG Альтернатива RAG: файловая система как метод управления контекстом Разработчики представили подход CEM888.AI, предлагающий использовать файловую систему в качестве основного механизма хранения и извлечения контекста для языковых моделей. В отличие от традиционных RAG-систем (Retrieval-Augmented Generation), которые опираются на векторный поиск по эмбеддингам, данный метод фокусируется на прямой работе с файловой структурой. Это позволяет модели обращаться к данным более предсказуемо, сохраняя иерархические связи и метаданные документов без потерь, характерных для семантического поиска. arXiv · Память и RAG Многоагентный фреймворк для защиты конфиденциальности в RAG-системах Исследователи представили многоагентный подход к защите данных в RAG-системах, предотвращающий утечки конфиденциальной информации через вредоносные промпты. Метод использует семантическое переписывание извлеченного контекста, позволяя сохранять точность ответов модели при строгом соблюдении приватности. Система разделяет задачи анализа, фильтрации и реконструкции данных между специализированными агентами, что минимизирует риски компрометации чувствительных документов в процессе генерации. The latest research from Google · Память и RAG Как Gemini Enterprise Agent Platform улучшает RAG для ИИ-агентов Google представил Agentic RAG — подход к Retrieval-Augmented Generation (RAG) в рамках своей платформы Gemini Enterprise Agent. Этот метод направлен на повышение надёжности и точности ответов ИИ-агентов за счёт улучшенного извлечения и использования контекста из внешних источников. Hacker News · Оркестрация агентов Инженерия контекста для аналитических ИИ-агентов: опыт разработки Разработка аналитических агентов требует перехода от простых промптов к сложной инженерии контекста. За шесть месяцев практики выяснилось, что качество ответов агента напрямую зависит от структурирования метаданных, семантического описания схем данных и управления историей диалога. Эффективная система должна динамически подбирать контекст, чтобы модель могла корректно интерпретировать сложные SQL-запросы и бизнес-метрики в условиях ограниченного окна контекста. arXiv · Память и RAG Как RAG помогает бороться с галлюцинациями в мультимодальных моделях Исследователи из MIT и других ведущих университетов предложили новый подход к снижению визуальных галлюцинаций в мультимодальных языковых моделях (MLLMs). Эти системы, способные обрабатывать как текстовые, так и визуальные данные, часто демонстрируют уверенность в своих ответах, даже когда визуальные данные слабые или неоднозначные. Это приводит к так называемым "галлюцинациям" — выводам, не соответствующим реальности.

← Все материалы