Национальное бюро экономических исследований (NBER) опубликовало фундаментальное руководство по использованию больших языковых моделей в историко-экономических изысканиях. Авторы анализируют, как генеративный ИИ трансформирует работу с архивными данными, автоматизирует оцифровку исторических документов и помогает в анализе неструктурированных текстов, предлагая методологическую базу для исследователей, стремящихся повысить точность и скорость обработки массивов исторической информации.
Работа фокусируется на практическом применении ИИ для решения задач, которые ранее требовали колоссальных временных затрат: от классификации исторических записей до извлечения количественных данных из рукописных или плохо сохранившихся печатных источников. Исследователи подчеркивают, что использование LLM позволяет не только ускорить рутинные процессы, но и выявлять скрытые закономерности в экономических данных прошлых столетий, которые ранее оставались вне поля зрения ученых из-за сложности их ручной обработки.
Особое внимание в документе уделяется вопросам валидации результатов и минимизации галлюцинаций моделей при работе с историческим контекстом. Авторы предлагают конкретные пайплайны для верификации данных, полученных с помощью ИИ, и обсуждают ограничения текущих архитектур при интерпретации специфической терминологии и экономических реалий прошлого. Это руководство становится важным инструментом для интеграции современных технологий в академическую среду гуманитарных наук.
Ключевые факты
- Публикация выпущена NBER (National Bureau of Economic Research) в рамках серии рабочих докладов под номером w35374.
- Основной фокус исследования направлен на автоматизацию извлечения данных из исторических архивов и их последующий количественный анализ.
- В документе предложены методы проверки точности ИИ-моделей при работе со сложными историческими текстами и специфической лексикой.
- Исследование демонстрирует способы масштабирования анализа экономических данных, которые ранее были ограничены возможностями ручного кодирования.