理想与现实世界 (hypothetical world & real world)
在现实世界中,一个人的隐私不可能完完全全被保护好,因为一个人的数据不是孤立的,它总是会和其他的数据联系起来,而从这些联系我们就可以推测出其中的部分信息。差分隐私使用了理想-现实世界模型来对安全性进行评估和建模。
我们将敌手建模为一个决策函数,其输入为 $ \mathcal{A}(D) $,输出一个对所有可能的决策的选择
在现实世界中,我们有一条个人数据 $ \nu $,有一数据集 $ D $ 包括 $ \nu $,敌手做出决策 $ c $
在理想世界中,$ \nu $ 的数据被彻底删除,没有这条数据,这条数据也就不可能泄露,这条数据也就得到了完美的保护。理想世界中的数据集记为 $ D_{-\nu} $
$ \epsilon - DP $ 保证对任意敌手,在理想和现实世界的决策差别不超过 $ e_\epsilon $($ e^\epsilon-close $),其中 $ \lambda-close $ 的定义如下:
当两概率值 $ p $ 和 $ p^\prime $ 为 $ \lambda-close $ 时:
$$ p \leq \lambda p^\prime \bigwedge p^\prime \leq \lambda p \bigwedge (1 - p) \leq \lambda (1 - p^\prime) \bigwedge (1 - p^\prime) \leq \lambda (1 - p) $$
个人数据原则 (PDP)
数据隐私是指赋予个人对其数据的控制权。如果个人数据没有被使用,那么就不会违反个人隐私。隐私并不意味着不了解个人的任何信息,也不代表着对个人无害,强制执行后者是不可行和不合理的。
作为对 PDP 的另一种支持,一种常见的保护隐私的方式是“选择退出”,一旦个体“选择退出”,个体的数据被删除,个体的隐私就得到了保护。
当相邻数据集的定义不正确时
- edge - DP
当两个图仅有一条边不同时,他们为相邻图 - node - DP
当一个图删除一个点和所有与其相连的边得到另一个图时,他们为相邻图
当每个节点代表一个个体时,使用 edge - DP 是不正确的,因为去除一条边并不等于对个人数据的控制,并且去掉一条边的图并不能被认为是一个理想世界(并没有完全删除一个人的数据)。对匿名化图数据的攻击就是以重新识别节点的形式出现的,而这正证明了点才是应该关注的重点所在。
群体隐私
群体隐私是个人隐私的延伸,群体隐私所保护的利益是人们为了实现自己的目标而聚集在一起、交流信息、分享感情、制定计划、一致行动的愿望和需要。