Hacker News · 02.07.2026 ·ИИ в бизнесе

Cloudflare вводит жесткие правила для ИИ-краулеров

Cloudflare обязала разработчиков ИИ-систем разделять трафик своих поисковых ботов и краулеров, предназначенных для обучения моделей. Владельцы сайтов, использующих инфраструктуру компании, теперь могут блокировать сбор данных для обучения ИИ, сохраняя при этом доступ для поисковых систем. Новые правила вступают в силу в ближайшее время, предоставляя владельцам ресурсов полный контроль над использованием их контента.

Этот шаг направлен на решение проблемы неконтролируемого сбора данных, который часто происходит без согласия правообладателей. Cloudflare предоставляет инструменты, позволяющие владельцам ресурсов одним кликом запретить доступ для ботов, которые занимаются парсингом контента для тренировки нейросетей. При этом поисковые системы, такие как Google или Bing, продолжат индексировать страницы для выдачи результатов поиска, если их краулеры не будут объединены с обучающими агентами.

Данная инициатива подчеркивает растущий конфликт между создателями ИИ-моделей и владельцами интеллектуальной собственности. Компании, занимающиеся разработкой генеративных моделей, вынуждены пересматривать свои подходы к сбору данных, чтобы избежать массовых блокировок со стороны крупных CDN-провайдеров и владельцев контента, обеспокоенных нарушением авторских прав и отсутствием компенсаций.

Ключевые факты

Cloudflare требует от разработчиков ИИ четко разделять ботов для индексации поиска и ботов для обучения моделей.
Владельцы сайтов получили возможность блокировать краулеры ИИ-компаний через панель управления Cloudflare.
Новые правила призваны защитить контент от несанкционированного использования в обучающих выборках.
Поисковые системы сохранят доступ к сайтам, если их краулеры не будут использоваться для обучения ИИ-моделей.
Решение принято на фоне участившихся споров между издателями контента и разработчиками ИИ-технологий.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

AI News & Artificial Intelligence | TechCrunch · Бизнес и инвестиции Cloudflare вводит новые правила для ИИ-краулеров Cloudflare обязала разработчиков ИИ до 15 сентября разделить поисковые краулеры и ботов, собирающих данные для обучения моделей. В противном случае компания предоставит владельцам сайтов инструменты для автоматической блокировки таких ботов. Это решение направлено на защиту контента издателей и создание механизма монетизации данных, используемых для тренировки нейросетей и работы агентных систем. The Cloudflare Blog · ИИ в бизнесе Cloudflare представила инструменты для контроля доступа ИИ-ботов к контенту Cloudflare запустила инициативы, позволяющие владельцам сайтов управлять тем, как ИИ-модели и поисковые системы индексируют их контент. Новые инструменты дают возможность блокировать нежелательных ботов или предоставлять доступ к данным на определенных условиях. Это решение направлено на защиту интеллектуальной собственности создателей контента в условиях стремительного роста агентских систем и генеративного поиска. Hacker News · ИИ в бизнесе Cloudflare запускает блокировку ИИ-скрейперов для защиты рекламных доходов Cloudflare представила инструмент для автоматической блокировки поисковых ботов и парсеров, которые собирают контент для обучения ИИ-моделей без компенсации владельцам сайтов. Новая функция позволяет владельцам ресурсов с рекламной моделью монетизации ограничивать доступ ботам, которые не приносят прямой пользы трафику или поисковой выдаче, защищая тем самым доходы от показа объявлений. The Cloudflare Blog · Данные и инжиниринг Cloudflare обновила инструменты управления ИИ-трафиком для владельцев сайтов Cloudflare представила расширенные настройки для контроля доступа ИИ-ботов к веб-ресурсам. Теперь владельцы сайтов могут дифференцированно управлять трафиком, разделяя поисковых роботов, агентные системы и ботов для обучения моделей. Новая функциональность также позволяет защищать страницы с рекламной монетизацией от несанкционированного скрапинга, обеспечивая более гибкий контроль над использованием контента в эпоху генеративного ИИ. The Cloudflare Blog · ИИ в бизнесе Cloudflare запустила инструмент для анализа активности ИИ-краулеров Cloudflare представила панель Attribution Business Insights, которая позволяет владельцам сайтов детально отслеживать активность ботов и краулеров, используемых для обучения ИИ. Инструмент помогает классифицировать запросы, оценивать их ценность для бизнеса и принимать обоснованные решения о монетизации контента или ограничении доступа для поисковых систем и разработчиков нейросетей. Hacker News · ИИ в маркетинге Beehiiv внедряет инструменты контроля за ИИ-краулерами Платформа для email-рассылок Beehiiv интегрировала технологию Cloudflare AI Crawl Control, предоставив авторам контента возможность управлять доступом ботов к своим публикациям. Теперь создатели рассылок могут в один клик разрешать или запрещать сканирование материалов для обучения больших языковых моделей. Это решение направлено на защиту интеллектуальной собственности и позволяет авторам сохранять контроль над тем, как их контент используется в экосистеме генеративного ИИ. Generative AI in Search Marketing: News & Expert Guides · ИИ в бизнесе Google и Shopify поддержали протокол Cloudflare для управления ИИ-ботами Google, Shopify и ряд разработчиков браузеров присоединились к инициативе Cloudflare по внедрению протокола PACT (Protocol for AI Content Transparency). Эта технология призвана дать владельцам сайтов и онлайн-платформ больше контроля над тем, как ИИ-агенты и поисковые краулеры взаимодействуют с их контентом. Протокол позволяет администраторам ресурсов устанавливать четкие правила доступа для автоматизированных систем, обеспечивая прозрачность и соблюдение авторских прав в условиях стремительного роста агентного ИИ. Hacker News · Данные и инжиниринг Pay-per-Crawl: новая модель монетизации веб-данных для обучения ИИ Проект Pay-per-Crawl предлагает рыночный подход к проблеме сбора данных, позволяя владельцам сайтов монетизировать контент через микроплатежи за каждый успешный запрос от краулеров. Эта модель призвана сбалансировать потребности разработчиков ИИ в качественных обучающих выборках и права владельцев ресурсов, которые сейчас массово блокируют доступ к своим данным из-за неконтролируемого парсинга. The Cloudflare Blog · Прогнозы и тренды Cloudflare: как агенты меняют экономику интернета и модель монетизации контента Спустя год после инициативы Content Independence Day, Cloudflare представила отчет о трансформации веб-экономики под влиянием автономных ИИ-агентов. Традиционная модель поискового трафика уступает место новой инфраструктуре, где агенты напрямую взаимодействуют с контентом. Это меняет правила игры для владельцев сайтов, требуя внедрения механизмов контроля доступа и монетизации для автоматизированных систем. Generative AI in Search Marketing: News & Expert Guides · Регулирование и политика Google обосновывает обучение ИИ на общедоступных данных принципом добросовестного использования Google опубликовала документ по управлению ИИ, в котором настаивает на сохранении принципа добросовестного использования (fair use) при обучении нейросетей на данных из открытого интернета. Компания утверждает, что такой подход необходим для развития технологий, предлагая при этом владельцам контента инструменты контроля, механизмы удаления данных и модели платного лицензирования для специализированных материалов.

← Все материалы