Hacker News · 17.06.2026 ·Машинное обучение

Обучение LLM точному следованию вероятностным инструкциям

Исследователи представили метод дообучения языковых моделей, позволяющий им с высокой точностью имитировать случайные процессы, такие как бросок игральной кости. Традиционные LLM часто демонстрируют предвзятость при генерации случайных чисел, отдавая предпочтение определенным цифрам из-за особенностей обучающей выборки и механизмов токенизации. Новый подход фокусируется на исправлении этой системной ошибки через специализированный этап пост-тренировки с использованием методов обучения с подкреплением.

В ходе экспериментов модель научили не просто имитировать случайность, а строго соблюдать заданные вероятностные распределения. Для оценки качества генерации использовались статистические тесты, подтверждающие, что результаты бросков кости соответствуют теоретически ожидаемым частотам. Это демонстрирует возможность корректировки «когнитивных искажений» моделей, которые возникают при попытке имитировать стохастическое поведение в задачах, требующих высокой точности.

Данное исследование подчеркивает важность контроля за вероятностными выходами нейросетей в прикладных сценариях. Способность модели надежно следовать заданным параметрам случайности критична для систем, где требуется честная симуляция или непредвзятая выборка данных. Метод дообучения позволяет минимизировать влияние скрытых паттернов в весах модели, обеспечивая предсказуемое поведение в задачах, где случайность является ключевым функциональным требованием.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

arXiv · Исследования и наука Улучшение точности прогнозирования LLM через управление признаками Исследователи представили метод повышения качества прогнозирования в больших языковых моделях, основанный на анализе их внутренних состояний. Используя разреженные автокодировщики, авторы выявили, что модели часто опираются на специфические временные знания, а не на общие закономерности. Управление этими внутренними признаками позволяет сместить фокус модели на обобщаемые паттерны, что значительно повышает точность предсказаний в различных задачах. Artificial intelligence – MIT Technology Review · Исследования и наука Проблема «группового мышления» в LLM и методы борьбы с предсказуемостью ответов Современные большие языковые модели демонстрируют склонность к предсказуемым паттернам и «групповому мышлению», выдавая схожие ответы на однотипные запросы. Исследователи и стартапы ищут способы преодолеть эту статистическую ограниченность, внедряя механизмы, которые заставляют модели выходить за рамки наиболее вероятных токенов, повышая вариативность и креативность генерации без потери логической связности ответов. arXiv · Исследования и наука Повышение надежности LLM через механизм селективного предсказания Исследователи представили новый метод повышения надежности больших языковых моделей (LLM) с помощью стратегии селективного предсказания (Selective Prediction). Подход позволяет модели самостоятельно определять случаи, в которых она с высокой вероятностью даст верный ответ, и отказываться от генерации при риске ошибки. Это критически важно для внедрения ИИ в системы принятия решений, где цена ошибки крайне высока. arXiv · Исследования и наука Новый метод повышения надежности LLM в условиях неопределенности Исследователи представили новый подход к генерации ответов и принятию решений для больших языковых моделей (LLM) в задачах с высокой степенью субъективности. Метод позволяет моделям лучше оценивать уровень собственной неуверенности, что критически важно для минимизации галлюцинаций и повышения доверия к результатам ИИ в сложных сценариях, где однозначный ответ отсутствует или требует экспертной интерпретации. Hacker News · Оценка и бенчмарки Критический анализ математических способностей современных LLM Исследователи провели независимую проверку математических навыков передовых языковых моделей, выявив значительные расхождения между заявленными результатами и реальной производительностью. Анализ показал, что многие модели демонстрируют признаки «заучивания» тестовых наборов данных, что приводит к завышению метрик точности при решении сложных задач, требующих глубокого логического вывода, а не простого воспроизведения паттернов из обучающей выборки. Hacker News · Исследования и наука Метакогнитивная обратная связь повышает точность оценки неопределенности в LLM Исследователи представили новый метод обучения LLM с использованием метакогнитивной обратной связи (RLMF), который значительно улучшает способность моделей оценивать собственную уверенность в ответах. В отличие от стандартного обучения с подкреплением, этот подход заставляет модель анализировать процесс собственного мышления, что снижает количество галлюцинаций и позволяет точнее определять границы знаний при решении сложных задач. arXiv · Оценка и бенчмарки Исследование Hindcast: почему LLM плохо справляются с прогнозированием событий Исследователи представили метод Hindcast для оценки точности LLM в прогнозировании событий через бэктестинг. Выяснилось, что текущие модели часто «жульничают» при тестировании: они либо находят информацию о свершившемся событии в сети, либо обучались на данных, содержащих ответы на вопросы. Это делает традиционные бенчмарки прогнозирования нерелеванными для оценки реальных аналитических способностей ИИ. Hacker News · Исследования и наука Сжатие LLM: почему высокая точность не гарантирует безопасность ответов Исследователи обнаружили, что методы сжатия LLM, такие как квантование и прунинг, позволяют моделям сохранять высокую точность на стандартных бенчмарках, но при этом провоцируют рост галлюцинаций. Даже при прохождении автоматических проверок качества сжатые модели начинают чаще выдумывать факты, что ставит под сомнение надежность оптимизированных систем в критических сценариях использования. Hacker News · Исследования и наука LLM как популяции: новый взгляд на обучение нейросетей Исследователи предлагают рассматривать большие языковые модели не как единые когнитивные системы, подобные человеческому разуму, а как динамические популяции статистических агентов. В отличие от людей, обучающихся через непрерывный опыт, LLM формируют свои ответы на основе распределений вероятностей, накопленных в процессе обучения на огромных массивах данных, что меняет понимание их способности к логике и обобщению. Hacker News · Исследования и наука Анализ ошибок LLM через метод Letterpaths Исследователь Робин Линакр представил метод Letterpaths для оценки когнитивных способностей языковых моделей. Подход позволяет выявлять скрытые закономерности в ответах LLM, даже когда модель допускает фактические ошибки. Анализ показывает, что модели часто демонстрируют глубокое понимание структуры языка и логических связей, несмотря на галлюцинации, что открывает новые возможности для интерпретации работы нейросетей.

← Все материалы