The Decoder · 25.06.2026 ·Оценка и бенчмарки

Authors Guild протестировала эффективность детекторов ИИ-контента

Гильдия авторов (Authors Guild) провела сравнительное тестирование пяти популярных инструментов для обнаружения ИИ-текстов. Результаты показали критический разброс в точности: некоторые сервисы безошибочно распознали человеческое авторство, в то время как другие ошибочно пометили все проверенные тексты как сгенерированные нейросетями. Исследование подчеркивает проблему надежности подобных детекторов в условиях современного издательского процесса.

В ходе эксперимента эксперты использовали тексты, написанные профессиональными авторами. Инструменты Pangram и Grammarly продемонстрировали стопроцентную точность, корректно определив человеческое происхождение всех материалов. Напротив, сервисы Sidekicker и ZeroGPT показали крайне низкие результаты, систематически классифицируя качественную человеческую работу как результат деятельности языковых моделей.

Авторы исследования указывают на фундаментальный парадокс: профессионально написанные тексты обладают статистическими характеристиками, которые крайне близки к выводам современных LLM. Поскольку модели обучаются на массивах высококачественного контента, их вероятностные паттерны часто совпадают со стилистикой опытных писателей. Это делает задачу автоматической детекции крайне сложной, так как инструменты часто принимают качественную структуру и логику изложения за признаки машинной генерации.

Ключевые факты

В тестировании участвовали пять инструментов: Pangram, Grammarly, Sidekicker, ZeroGPT и GPTZero.
Pangram и Grammarly успешно прошли проверку, верно определив все образцы человеческого письма.
Sidekicker и ZeroGPT показали 0% точности, ошибочно пометив все человеческие тексты как ИИ-контент.
Гильдия авторов предупреждает, что высокая стилистическая связность профессиональных текстов делает их статистически неотличимыми от ответов нейросетей для многих алгоритмов.

Источник: The Decoder

Обсудить с ИИ

Похожие материалы

Hacker News · ИИ в маркетинге Альтернатива детекторам ИИ: верификация авторства через запись процесса письма Вместо попыток обучить нейросети распознавать сгенерированный контент, авторы проекта HumanWroteThis предлагают фиксировать процесс создания текста в реальном времени. Инструмент записывает каждое нажатие клавиши и движение курсора, создавая воспроизводимую историю написания документа. Это позволяет подтвердить, что текст был создан человеком, а не сгенерирован ИИ-моделью, обеспечивая прозрачность авторства в академической и профессиональной среде. arXiv · Исследования и наука Исследование: читатели предпочитают художественные переводы от людей, а не от ИИ Исследователи проанализировали восприятие художественных текстов, переведенных с помощью ИИ и профессиональных переводчиков. Хотя алгоритмы успешно справляются с передачей базового смысла и грамматической точностью, читатели отмечают значительную разницу в погружении и литературной выразительности. Автоматические метрики качества оказались неспособны уловить тонкие эмоциональные аспекты, которые делают текст по-настоящему художественным и вовлекающим для аудитории. Hacker News · Исследования и наука Исследование StoryScope: анализ специфики генеративной художественной литературы Исследователи представили StoryScope — методологию для систематического анализа особенностей текстов, созданных большими языковыми моделями в жанре художественной литературы. Работа сфокусирована на выявлении характерных паттернов, которые отличают ИИ-контент от произведений, написанных людьми. Авторы анализируют, как модели справляются с поддержанием долгосрочной связности сюжета, развитием персонажей и стилистической устойчивостью на протяжении длинных повествовательных форм. Hacker News · Исследования и наука ИИ способствует научной монокультуре: анализ цитирований Исследование, опубликованное в Nature, указывает на риск снижения разнообразия в научной среде из-за повсеместного внедрения ИИ. Анализ миллионов публикаций показал, что использование алгоритмов для написания и обработки текстов приводит к стандартизации лексики и сужению тематического охвата. Это создает «научную монокультуру», где новые идеи вытесняются предсказуемыми результатами, соответствующими паттернам обучающих выборок моделей. arXiv · Исследования и наука Исследование: тесты в коде от ИИ-агентов часто бессмысленны Исследователи изучили качество тестов, генерируемых ИИ-агентами в открытых репозиториях. Оказалось, что более 932 000 пулл-реквестов с кодом от ИИ содержат тесты без проверочной логики. Это значит, что тесты просто запускают код, но не проверяют его корректность. arXiv · Оценка и бенчмарки Исследование: современные голосовые ИИ-системы игнорируют эмоциональную окраску речи Исследователи проанализировали работу четырех передовых систем голосового ИИ: GPT-4o (OpenAI), Gemini 1.5 Flash (Google), а также Qwen2.5 Omni Plus и Omni Flash (Alibaba). Выяснилось, что модели фокусируются исключительно на текстовом содержании запроса, полностью игнорируя паралингвистические сигналы — интонацию, темп и эмоциональную окраску, которые критически важны для понимания контекста и намерений говорящего. Hacker News · ИИ в маркетинге Исследование использования LLM при написании технических блогов Анализ практики использования больших языковых моделей для создания контента в технологическом секторе показывает, что авторы все чаще делегируют ИИ рутинные задачи. Основными сценариями стали структурирование черновиков, генерация пояснительных примеров кода и адаптация сложных технических концепций под разные уровни подготовки аудитории. Использование инструментов на базе LLM позволяет сократить время на подготовку публикаций в среднем на 30–40%, при этом сохраняя фокус на экспертной составляющей материала. Generative AI in Search Marketing: News & Expert Guides · ИИ в маркетинге Google предложила новый метод борьбы с ИИ-спамом в поисковой выдаче Исследователи Google представили подход к выявлению низкокачественного контента, созданного с помощью генеративного ИИ. Вместо анализа текста каждой отдельной страницы, алгоритмы предлагают сфокусироваться на идентификации сетей и инфраструктур, которые массово генерируют и распространяют автоматизированный контент. Такой метод позволяет эффективнее отсеивать спам, опираясь на технические характеристики источников, а не только на лингвистические особенности материалов.

← Все материалы