Разработчики представили вторую версию бенчмарка PES (Physical Evaluation Score), предназначенного для выявления видеоконтента, созданного нейросетями. Инструмент фокусируется на анализе физической достоверности движений объектов в кадре. Показатель эффективности метода, выраженный через коэффициент Коэна, достиг 10.4, что свидетельствует о высокой точности различения реальных записей и синтетических генераций на текущем этапе развития технологий.

Проблема верификации видео становится критической на фоне прогресса генеративных моделей, которые всё чаще имитируют реалистичную физику. Традиционные методы детекции, основанные на анализе артефактов текстур или освещения, часто оказываются неэффективными против современных архитектур. Новый подход делает упор на динамические характеристики, отслеживая микро-несоответствия в траекториях и взаимодействии объектов с окружающей средой, которые нейросети пока не способны воспроизвести идеально.

Данный бенчмарк предоставляет исследователям стандартизированный набор данных и метрик для оценки устойчивости моделей к детекции. Использование PES v0.2 позволяет разработчикам систем безопасности и медиа-платформам тестировать свои алгоритмы на предмет защиты от дипфейков и синтетического контента, который может быть использован для введения пользователей в заблуждение или создания неаутентичных материалов.

Ключевые факты

  • Коэффициент Коэна (Cohen's d) для бенчмарка составляет 10.4, что указывает на очень высокий размер эффекта при различении классов.
  • PES v0.2 специализируется на выявлении аномалий в физике движений, а не на визуальных артефактах пикселей.
  • Инструмент ориентирован на автоматизированную проверку видеопотоков, созданных современными генеративными моделями.
  • Проект опубликован в открытом доступе для стандартизации методов оценки безопасности и достоверности медиаконтента.