论文部分内容阅读
近年来,随着定位技术以及基于位置应用的不断普及,应用提供商和研究机构积累了大量的用户轨迹数据,用于研究、分析和发布。其中,轨迹数据的发布是以发掘轨迹数据学术价值和商业价值为目的,将积累的用户轨迹数据发布给学术和商业研究机构,用于进行城市规划、行为模式分析、商业决策等研究。隐私保护问题在轨迹数据发布的发展中具有关键性意义,并已成为一个研究热点。但由于轨迹数据具有大规模、高维度、以及背景知识丰富等特点,使得轨迹隐私保护问题的研究面临着严峻的挑战。本文主要对轨迹数据发布中的隐私保护技术进行了深入研究,提出了用于解决轨迹匿名问题的(k,△)-匿名模型,并在该模型基础上设计并实现了UPG轨迹隐私保护算法。在(k,△)-匿名模型中,利用轨迹数据本身所具有的不确定性,降低了轨迹匿名过程中的匿名成本。UPG轨迹隐私保护算法中,首先对轨迹进行基于MDL原则的特征分段,然后对轨迹分段进行基于聚类约束策略的匿名化处理,解决了传统轨迹隐私保护算法中存在的匿名组特征单一的问题,可以有效的防止针对发布数据特征的二次聚类攻击。最后在本文的实验部分,分别从数据质量和数据可用性两个角度,对本文提出的隐私保护算法进行性能测评,并将(k,△)匿名算法与经典NWA算法进行比较。结果表明,(k,△)-匿名模型下的隐私保护算法,在大多数情况下具有更小的匿名成本。而UPG算法以极小的数据质量代价,极大的提高了隐私保护等级。本文首先介绍了轨迹发布中隐私保护相关的背景知识。然后,对轨迹隐私保护中的轨迹匿名模型进行了研究,提出了利用轨迹本身不确定性的(k,△)-匿名模型。接着,在(k,△)-匿名模型的基础上,提出了基于分段聚类的轨迹隐私保护算法UPG。之后,通过仿真实验,验证了(k,△)-匿名模型与UPG算法的有效性。最后,对全文内容进行归纳总结,并指出本文研究工作中存在不足及未来的研究方向。