Исследования и наука

OpenMLE: новая платформа для исследования рекурсивного самообучения ИИ arXiv · 30.07.2026 Исследователи представили OpenMLE — открытую экосистему для изучения рекурсивного самообучения (RSI) в задачах машинного обучения. Система позволяет ИИ-агентам самостоятельно совершенствовать процессы разработки моделей, используя среду OpenMLE-Gym для верификации кода и обучения операторов. Проект направлен на создание автономных систем, способных оптимизировать собственный жизненный цикл разработки без участия человека. Новый метод обучения представлений для анализа причинно-следственных связей в медицине arXiv · 30.07.2026 Исследователи представили метод «Doubly Robust Functional Representation Learning» для анализа данных с нерегулярными временными интервалами. Подход позволяет эффективно оценивать причинно-следственные эффекты в лонгитюдных исследованиях, где показатели здоровья, такие как результаты анализов или данные датчиков, фиксируются неравномерно. Алгоритм сочетает функциональное обучение представлений с двойной робастностью, обеспечивая высокую точность оценок даже при наличии пропусков в данных. ИИ-доказательство гипотезы Коллатца выявило критическую ошибку в ядре Lean Hacker News · 30.07.2026 Исследователи использовали ИИ для генерации формального доказательства гипотезы Коллатца, которое было успешно верифицировано в системе Lean. Однако в процессе проверки обнаружилась фундаментальная ошибка в самом ядре Lean, позволяющая системе принимать неверные математические утверждения как доказанные. Этот инцидент подчеркивает риски автоматизации формальной верификации и необходимость тщательного аудита инструментов, используемых для математических доказательств. Метод APO для предсказания 3D-структур атомных систем без разметки arXiv · 30.07.2026 Исследователи представили APO (Atomic Policy Optimization) — новый метод обучения моделей для предсказания 3D-структур в материаловедении и фармакологии. В отличие от существующих подходов, требующих эталонных данных, APO использует обучение без учителя. Это позволяет эффективно моделировать новые кристаллические фазы и белки, для которых экспериментальные координаты атомов пока недоступны или слишком сложны для получения. Графовые нейросети ускоряют моделирование спиновой динамики в металлических магнитах arXiv · 30.07.2026 Исследователи представили новый фреймворк на базе графовых нейронных сетей (GNN) для моделирования спиновой динамики в металлических магнитах. Метод позволяет предсказывать магнитные взаимодействия, заменяя ресурсоемкие квантово-механические расчеты электронной структуры. Это решение устраняет вычислительный барьер, значительно ускоряя симуляции временной эволюции магнитных систем, что критически важно для материаловедения и разработки новых магнитных материалов. Влияние языковых моделей на стандартизацию английского языка arXiv · 30.07.2026 Исследователи проанализировали, как современные большие языковые модели закрепляют доминирование определенных диалектов английского языка. Работа показывает, что алгоритмы отдают предпочтение нормам «внутреннего круга» (США, Великобритания), маргинализируя региональные варианты. Это создает риск унификации языка и подавления лингвистического разнообразия, что напрямую влияет на то, какие формы речи воспринимаются как «правильные» в глобальных цифровых коммуникациях. Новый подход к обновлению знаний ИИ-агентов через Selective Credibility-Limited Belief Update arXiv · 30.07.2026 Исследователи представили метод Selective Credibility-Limited Belief Update, который совершенствует механизмы обновления знаний ИИ-агентов при изменении внешней среды. В отличие от классической модели Кацуно-Мендельзона, предполагающей доступность всех состояний мира, новый подход ограничивает набор «достоверных» состояний, что позволяет агентам точнее фильтровать входящую информацию и эффективнее адаптироваться к динамическим изменениям без накопления логических противоречий. Новый метод обучения агентов для безопасной эксплуатации уязвимостей противника arXiv · 30.07.2026 Исследователи представили метод обучения ИИ-агентов, позволяющий им эффективно использовать ошибки противника в играх с нулевой суммой и неполной информацией. В отличие от стандартных стратегий равновесия Нэша, которые гарантируют лишь базовый результат, новый подход позволяет агентам безопасно адаптироваться к слабым местам оппонента, минимизируя при этом риск собственного поражения из-за неполных моделей поведения. Новая модель анализа креативности в литературных текстах через трансформацию arXiv · 30.07.2026 Исследователи представили методологию моделирования креативности как процесса селективной трансформации существующих артефактов, а не изолированного изобретения. Авторы опираются на теории имитации Габриэля Тарда и Джеймса Марка Болдуина, предлагая многоуровневый фреймворк для анализа изменений в литературных текстах. Работа позволяет количественно оценивать степень новизны и способы переработки исходного материала в культурных произведениях, что открывает новые возможности для NLP-анализа творческого контента. Влияние генеративного ИИ на лингвистическое разнообразие в академических публикациях arXiv · 30.07.2026 Исследование, опубликованное на платформе arXiv, анализирует риски, которые генеративный ИИ создает для академической среды в контексте языковой инклюзивности. Ученые обсуждают, как доминирование стандартных моделей, обученных преимущественно на текстах на «стандартном» английском языке, может привести к маргинализации региональных вариантов английского и снижению лингвистического разнообразия в глобальных научных коммуникациях, требуя пересмотра подходов к использованию ИИ в публикационной деятельности. TCA-SIR: новый метод поиска научных гипотез через целевые абстракции arXiv · 30.07.2026 Исследователи представили метод TCA-SIR, который улучшает поиск научной литературы для генерации гипотез. В отличие от традиционных систем, ранжирующих статьи по тематическому сходству, новый подход использует целевые абстракции. Это позволяет ИИ находить неочевидные междисциплинарные связи и переносить методы решения задач из одной научной области в другую, повышая качество автоматизированного научного поиска. Роль причинно-следственных связей в алгоритмическом исправлении решений arXiv · 30.07.2026 Исследователи проанализировали методы алгоритмического исправления (algorithmic recourse), которые помогают пользователям менять результаты автоматизированных систем, например, при отказе в кредите. В работе доказывается, что текущие подходы часто фокусируются лишь на изменении предсказания модели, игнорируя реальные причинно-следственные связи. Это приводит к рекомендациям, которые формально меняют вердикт ИИ, но не улучшают фактическую квалификацию заявителя. Новый подход к анализу финансовых новостей с помощью структурированного извлечения данных arXiv · 30.07.2026 Исследователи представили метод структурированного извлечения данных из финансовых новостей, выходящий за рамки простого анализа тональности. Вместо сведения контента к единому показателю полярности, модель классифицирует информацию по типам событий, масштабу влияния, временному горизонту и семантической достоверности. Это позволяет более точно прогнозировать рыночные движения, учитывая многомерный характер новостных потоков и их реальное влияние на активы. Исследование влияния KV-кэша на точность генерации LLM arXiv · 30.07.2026 Исследователи проанализировали механизм работы KV-кэша в моделях семейства Qwen2.5, изучив влияние повторного использования промежуточных состояний на итоговый результат генерации. Эксперимент показал, что при реконструкции токенов через «stage-replay» возникают расхождения в предсказаниях по сравнению с полным пересчетом префикса. Это ставит под сомнение точность стандартных методов кэширования при выполнении сложных логических цепочек. Нейросимвольный подход для оценки состояния канализационных сетей arXiv · 30.07.2026 Исследователи представили нейросимвольный фреймворк для оценки степени износа канализационных труб, решающий проблему «черного ящика» в классических методах компьютерного зрения. Система разделяет визуальное распознавание дефектов и логический вывод, используя нечеткую логику для интерпретации результатов. Это позволяет повысить прозрачность диагностики и точность классификации повреждений в критической городской инфраструктуре, минимизируя ошибки автоматизированных систем мониторинга. Исследование: как «предвзятость значимости» мешает LLM в здравом смысле arXiv · 30.07.2026 Исследователи выявили критическую уязвимость современных больших языковых моделей, названную «предвзятостью значимости» (Salience Bias). В задачах на здравый смысл модели склонны чрезмерно полагаться на явные, но бесполезные детали во входных данных, такие как случайные числа или второстепенные условия. Это приводит к игнорированию контекста и логическим ошибкам, даже если модель способна решать сложные задачи. Методы верификации результатов квантовых вычислений Ars Technica - All content · 30.07.2026 Исследователи представили три новых подхода к проверке точности квантовых вычислений, которые превосходят возможности классических суперкомпьютеров. Проблема верификации результатов квантового превосходства долгое время оставалась барьером для практического применения технологии. Новые методы позволяют подтверждать корректность вычислений, даже когда классические алгоритмы не способны воспроизвести или проверить полученные данные напрямую, обеспечивая надежность квантовых систем в сложных задачах. Борьба с галлюцинациями ИИ-агентов в торговле через репутационные штрафы arXiv · 30.07.2026 Исследователи предложили механизм репутационных штрафов для борьбы с фабрикацией характеристик товаров ИИ-агентами в условиях маркетплейсов. Поскольку платформы не могут верифицировать каждое утверждение модели, предложенная система использует косвенные сигналы для оценки честности агентов. Метод позволяет снизить уровень дезинформации, сохраняя при этом конкурентоспособность автономных торговых систем без необходимости прямой проверки каждого описания товара. ObjectStream: новый подход к обработке видеопотоков через объектную память arXiv · 30.07.2026 Исследователи представили ObjectStream — метод обработки видеопотоков, который организует визуальную память вокруг устойчивых объектов, а не через сегменты или временные интервалы. В отличие от традиционных подходов, фокусирующихся на важности токенов, эта архитектура отслеживает эволюцию объектов во времени, что позволяет моделям эффективнее удерживать контекст при анализе длительных видеопотоков и отвечать на сложные вопросы о событиях. Новый метод анализа эффективности роутинга в MoE-моделях arXiv · 30.07.2026 Исследователи представили Expert Subspace Separation Index (ESSI) — метрику для оценки качества маршрутизации токенов в разреженных моделях Mixture-of-Experts (MoE). Метод позволяет разделить влияние когерентности маршрутов, качества экспертов и их взаимодействия с контекстом, опровергая упрощенное представление о том, что эффективность MoE зависит исключительно от геометрической комплементарности векторов представления экспертов. Автоматизация проектирования микросервисов с помощью LLM arXiv · 30.07.2026 Исследователи проанализировали эффективность LLM в автоматическом проектировании архитектуры микросервисов на основе текстовых требований. В отличие от традиционных подходов, ориентированных на анализ существующего кода, предложенный метод позволяет переходить к системному дизайну на ранних этапах разработки. Работа оценивает точность декомпозиции систем и качество формируемых связей между сервисами, предлагая новый стандарт для оценки агентных систем в архитектурном проектировании. MonoVoc: эффективная 3D-реконструкция сцен с открытым словарем arXiv · 30.07.2026 Исследователи представили MonoVoc — метод для создания 3D-сцен с поддержкой семантического поиска по естественному языку на основе монокулярных данных. Решение разделяет геометрические и семантические признаки, что позволяет значительно снизить требования к памяти и вычислительным ресурсам при работе с 3D-гауссианами, устраняя необходимость в сложных многоракурсных съемках и длительной оптимизации под конкретные сцены. Tycho: агентная система для решения задач ARC-AGI через построение моделей мира arXiv · 30.07.2026 Исследователи представили Tycho — агентную систему, предназначенную для решения задач ARC-AGI-3, где требуется активная абстракция и быстрое обучение навыкам. Система формализует игровые среды как параметризованные детерминированные машины Мура и использует программные модели мира для вывода скрытых правил, состояний и целей, минимизируя количество необходимых действий для достижения результата. Theia: автоматизированная разметка и валидация датасетов для обучения VLM arXiv · 30.07.2026 Исследователи представили Theia — систему для автоматизированного описания и проверки мультимодальных данных, направленную на решение проблемы нехватки качественных датасетов для обучения Vision-Language Models (VLM). Инструмент позволяет эффективно обрабатывать масштабные наборы данных, такие как Incidents1M, устраняя семантические расхождения между изображениями и текстовыми описаниями, что критически важно для методов дистилляции знаний без исходных данных.