Новое исследование, опубликованное на arXiv, анализирует тенденции в документировании AI-исследований за последние десять лет. Авторы проанализировали 56 800 конференционных статей, чтобы понять, как изменились практики документирования в ответ на кризис воспроизводимости результатов.

Кризис воспроизводимости в AI привел к тому, что ведущие конференции и журналы начали требовать от авторов заполнять специальные чек-листы, которые помогают оценить качество и полноту предоставленных данных. Исследование показывает, что с введением таких чек-листов в 2015 году количество статей, содержащих достаточную информацию для воспроизведения, значительно увеличилось.

Авторы отмечают, что наиболее значимые изменения произошли в области машинного обучения и компьютерного зрения. В этих областях доля статей с полным описанием методов и данных выросла на 30% по сравнению с 2015 годом. Однако, несмотря на прогресс, многие статьи все еще содержат недостаточно информации для полного воспроизведения экспериментов.

Исследование подчеркивает важность продолжающих усилий по улучшению практик документирования. Это особенно актуально для разработчиков ИИ-агентов, так как воспроизводимость результатов является ключевым фактором для создания надежных и эффективных систем. Понимание текущих тенденций в документировании помогает улучшать процессы разработки и внедрения ИИ-технологий.