
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.1.1 重标识出Karrie有多难
这是一个虚构的攻击场景,但在实际场景中实施关联攻击的难度也是出乎意料的低。有多低?事实证明,在绝大多数情况下,只需要一个数据点作为辅助信息就足以重标识出一行数据。


邮政编码本身就足以让我们重标识出Karrie了。那出生日期呢?

这一次返回了三行数据。我们不知道哪一行才是Karrie的数据。即便如此,我们仍然得到了很多信息。
●我们知道Karrie的收入低于5万美元的概率是2/3。
●可以观察各行之间的差异,以确定哪些额外的辅助数据可以帮助我们进一步区分各行数据所属的个体。在本例中,性别、职业、婚姻状况都可以帮助我们进一步重标识出Karrie。