Исследователи представили концепцию «приватности через предсказуемость» (privacy via predictability), которая предлагает альтернативу традиционной дифференциальной приватности (DP). В отличие от классических методов, ориентированных на защиту от «худшего сценария» и часто снижающих точность моделей, новый подход позволяет более гибко настраивать баланс между защитой данных и полезностью алгоритмов. Метод учитывает конкретные знания злоумышленника о наборе данных, что делает оценку рисков более точной и менее затратной для производительности систем.

В основе работы лежит математическая модель, которая анализирует, насколько информация в датасете может быть предсказана на основе уже известных атакующему данных. Это позволяет формализовать утечки информации не как абстрактную вероятность, а как измеримую величину, зависящую от структуры данных и используемых стохастических процессов. Такой подход дает возможность разработчикам внедрять меры защиты, которые адаптируются под конкретные угрозы, а не просто ограничивают доступ к данным по жестким правилам.

Авторы исследования подчеркивают, что текущие стандарты дифференциальной приватности зачастую избыточны, так как они предполагают наличие у атакующего практически неограниченных ресурсов и знаний. Переход к гранулярной оценке приватности поможет создавать системы машинного обучения, которые сохраняют высокую точность при соблюдении необходимых стандартов безопасности. Это особенно актуально для обучения моделей на чувствительных пользовательских данных, где сохранение статистических закономерностей критически важно для качества работы ИИ.