论文部分内容阅读
随着手机等移动定位设备的普遍使用,移动对象的轨迹数据越来越容易产生和收集。对这些轨迹数据进行分析和挖掘,可以获得很多有用的信息。但如何保护轨迹数据中所包含的移动对象的敏感信息不被泄露是一个很重要的现实问题,也是数据库领域的一个研究热点。以k-匿名为代表的传统的轨迹数据隐私保护方法是将满足不相交隐私约束的轨迹数据统一划分到同一组中,然后对同一组中的记录添加干扰记录等方式进行统计发布。传统的轨迹数据隐私保护方法假设攻击者不掌握与轨迹数据相关的背景知识,在互联网时代,攻击者可以通过很多渠道获取足够多的背景知识,因此,传统的轨迹数据隐私保护方法很难提供很强的隐私保护。差分隐私是目前轨迹数据隐私保护的一个主要方法。差分隐私具有信息论意义上的安全性,它通过扰动的方式为数据添加噪音,使得整个数据的信息熵几乎没有变化。攻击者即使知道数据中的部分内容,也无法推测出数据中具体的个体信息。本文重点研究基于差分隐私的轨迹数据实时发布方法,主要研究内容和研究成果总结如下:对于某一时刻的轨迹数据,提出了基于差分隐私的直方图发布算法APG。APG首先使用基于指数机制的排序算法,然后结合AP聚类算法对排序后的结果进行自适应聚类分组,最后在分组的结果上添加噪音;对移动对象长度为L的轨迹数据,提出了动态隐私预算分配算法RTPM,RTPM使用指数衰减机制,合理分配当前时刻隐私预算,并为将来的轨迹数据预留出相应大小的隐私预算。本文的创新点有以下几点:提出了基于指数机制的排序算法,结合AP聚类算法,通过MSE指标和聚类因子λ来自适应分组,获取最优分组策略。在满足?-差分隐私要求的基础上,平衡了组均值产生的近似误差AE和添加拉普拉斯噪音产生的拉普拉斯误差LE,有效地降低了发布数据的误差MSE,提高了数据的可用性;提出了动态隐私预算分配算法,为每个时刻的轨迹数据自主的分配隐私预算,提高隐私预算的利用率,较好的保护移动对象长度为L的轨迹数据的隐私。该动态隐私预算分配算法针对每个移动对象、长为L的轨迹进行动态分配,每个移动对象的L-轨迹隐私预算之和需要小于等于总隐私预算。该算法为当前时刻每个移动对象分配未使用隐私预算的一半,为移动对象将来的轨迹数据保留另一半的隐私预算。