arXiv · 29.06.2026 ·Исследования и наука

Использование LLM для анализа грантовых заявок и поиска перспективных научных направлений

Исследователи в рамках проекта «Tracking Stars and Unicorns» оценили эффективность LLM для автоматического извлечения сущностей и классификации тем в грантовых заявках UKRI. Сравнение GPT-4o, Mistral и специализированного алгоритма DSIT-Taxonomies показало возможности ИИ в выявлении ранних сигналов появления новых научных областей для оптимизации государственного финансирования и анализа метанаучных данных.

Работа сфокусирована на автоматизации обработки больших массивов проектной документации, что традиционно требует значительных временных затрат экспертов. Использование языковых моделей позволяет не только структурировать данные о текущих исследованиях, но и выстраивать таксономии, которые динамически адаптируются к изменениям в научной повестке. Это критически важно для принятия решений о распределении инвестиций в инновационные сектора.

Методология проекта опирается на сопоставление результатов работы универсальных моделей с кастомными алгоритмами классификации. Такой подход позволяет оценить точность извлечения специфических терминов и связей между ними, что необходимо для построения карт научных компетенций. Полученные данные помогают государственным структурам быстрее реагировать на сдвиги в академической среде и поддерживать наиболее перспективные направления на ранних стадиях.

Ключевые факты

Проект финансируется UKRI (UK Research and Innovation) и направлен на развитие метанаучных исследований.
В исследовании сравнивались три подхода: GPT-4o, Mistral и специализированный алгоритм DSIT-Taxonomies.
Основная цель — идентификация ранних сигналов возникновения новых научных областей для управления инвестициями.
Методология включает автоматизированное извлечение сущностей и классификацию тем из текстов грантовых заявок.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Исследования и наука ИИ автоматизирует проверку воспроизводимости исследований Учёные из Гарварда и MIT разработали метод, позволяющий использовать большие языковые модели (LLM) для автоматизированной оценки воспроизводимости исследований в социальных и поведенческих науках. Обычно проверка воспроизводимости требует ручного анализа данных независимыми исследователями, что занимает много времени и ресурсов. Новый подход позволяет значительно ускорить этот процесс, применяя LLM для анализа опубликованных данных и оценки их достоверности. arXiv · Машинное обучение Новая архитектура Gated Multi-Task Learning для анализа судебных решений Исследователи представили архитектуру Judge-Aware Gated Multi-Task Learning, предназначенную для разделения объективных фактов дела и субъективного судейского усмотрения при прогнозировании юридических исходов. Модель использует многозадачное обучение с гранулярной таксономией результатов, что позволяет точнее интерпретировать логику судебных решений и выявлять факторы, влияющие на вариативность приговоров в схожих правовых ситуациях. Hacker News · Данные и инжиниринг Использование LLM как «сита» для масштабируемого сбора данных Автор блога Zamechek продемонстрировал эффективный метод расширения наборов данных с помощью LLM, названный «ситом». Начав всего с 12 имен, алгоритм итеративно находил новые сущности, проверяя их на соответствие заданным критериям. Этот подход позволяет автоматизировать сбор специфических списков, минимизируя ручную работу и обеспечивая высокую точность фильтрации данных при минимальных исходных ресурсах. arXiv · Исследования и наука Метод SIFT повышает точность фактчекинга в LLM через проверку обоснованности доказательств Исследователи представили метод SIFT (Claim-Conditioned Re-scoring), решающий проблему «разрыва обоснований» (Warrant Gap) в ИИ-системах проверки фактов. Хотя современные LLM показывают высокую точность на бенчмарках, они часто подтверждают утверждения, используя нерелевантные доказательства. Новый подход переоценивает извлеченные данные с учетом контекста исходного утверждения, что позволяет выявлять логические несоответствия между фактом и цитируемым источником. Hacker News · Оценка и бенчмарки TreasuryBench: открытый бенчмарк для оценки ИИ в сфере личных финансов TreasuryBench — это новый открытый бенчмарк, предназначенный для оценки способности больших языковых моделей давать качественные советы по управлению личными финансами. Проект включает набор данных и методологию, позволяющую измерить точность, логику и соответствие рекомендаций финансовым стандартам, что критически важно для автоматизации консультационных услуг и снижения рисков при использовании ИИ в финансовой сфере. Hacker News · ИИ в бизнесе Автоматическая классификация контента с помощью BERTopic и LLM Вики Бойкис представила практический подход к автоматизации тегирования контента, объединив возможности тематического моделирования BERTopic и больших языковых моделей. Метод позволяет эффективно структурировать архив публикаций, преобразуя неструктурированный текст в организованную систему тегов. Это решение демонстрирует, как комбинация классических NLP-инструментов и современных LLM помогает оптимизировать управление данными и улучшить навигацию по контенту. The Gradient · Память и RAG Как LLMs меняют финансовые рынки и инвестиции В 2023 году ИИ-революция привлекла огромные инвестиции в частные и публичные компании, а также завоевала внимание широкой аудитории. Одним из ключевых драйверов этого роста стали большие языковые модели (LLMs), которые лежат в основе таких продуктов, как ChatGPT. Эти модели демонстрируют удивительную способность моделировать последовательности токенов, представляющих слова или их части, что открывает новые возможности для анализа и прогнозирования на финансовых рынках. Hacker News · ИИ в бизнесе Система автоматизированного анализа фондового рынка на базе LLM Проект Daily_stock_analysis представляет собой комплексную систему для автоматизированного сбора и интерпретации данных фондового рынка. Инструмент использует возможности больших языковых моделей для обработки финансовых новостей, отчетов и рыночных показателей, формируя ежедневные аналитические сводки по различным активам. В основе решения лежит пайплайн, который объединяет парсинг актуальных данных из открытых источников с последующим семантическим анализом для выявления ключевых рыночных трендов. arXiv · Исследования и наука Исследование: классификация киберугроз с помощью открытых моделей Учёные изучили, как открытые языковые модели могут автоматизировать классификацию киберугроз по стандарту MITRE ATT&CK. Ранее этот процесс требовал значительных человеческих усилий, а до появления LLM автоматизация была ограничена сложностью анализа неструктурированных отчётов о киберугрозах (CTI). arXiv · Безопасность и алайнмент Метод AIMS: повышение точности классификации безопасности LLM через анализ намерений Исследователи представили подход AIMS, который повышает эффективность классификации безопасности LLM за счет явного моделирования намерений пользователя. Внедрение описания намерений в процесс обучения позволяет моделям точнее различать вредоносные запросы и безопасные взаимодействия. Новый датасет из 1724 сложных примеров помогает оценивать работу систем безопасности в различных режимах обучения, включая SFT и обучение с подкреплением на основе предпочтений.

← Все материалы