面向轨迹数据发布的隐私保护技术研究

来源 :东北大学 | 被引量 : 4次 | 上传用户:fengfeiyuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着定位技术以及基于位置应用的不断普及,应用提供商和研究机构积累了大量的用户轨迹数据,用于研究、分析和发布。其中,轨迹数据的发布是以发掘轨迹数据学术价值和商业价值为目的,将积累的用户轨迹数据发布给学术和商业研究机构,用于进行城市规划、行为模式分析、商业决策等研究。隐私保护问题在轨迹数据发布的发展中具有关键性意义,并已成为一个研究热点。但由于轨迹数据具有大规模、高维度、以及背景知识丰富等特点,使得轨迹隐私保护问题的研究面临着严峻的挑战。本文主要对轨迹数据发布中的隐私保护技术进行了深入研究,提出了用于解决轨迹匿名问题的(k,△)-匿名模型,并在该模型基础上设计并实现了UPG轨迹隐私保护算法。在(k,△)-匿名模型中,利用轨迹数据本身所具有的不确定性,降低了轨迹匿名过程中的匿名成本。UPG轨迹隐私保护算法中,首先对轨迹进行基于MDL原则的特征分段,然后对轨迹分段进行基于聚类约束策略的匿名化处理,解决了传统轨迹隐私保护算法中存在的匿名组特征单一的问题,可以有效的防止针对发布数据特征的二次聚类攻击。最后在本文的实验部分,分别从数据质量和数据可用性两个角度,对本文提出的隐私保护算法进行性能测评,并将(k,△)匿名算法与经典NWA算法进行比较。结果表明,(k,△)-匿名模型下的隐私保护算法,在大多数情况下具有更小的匿名成本。而UPG算法以极小的数据质量代价,极大的提高了隐私保护等级。本文首先介绍了轨迹发布中隐私保护相关的背景知识。然后,对轨迹隐私保护中的轨迹匿名模型进行了研究,提出了利用轨迹本身不确定性的(k,△)-匿名模型。接着,在(k,△)-匿名模型的基础上,提出了基于分段聚类的轨迹隐私保护算法UPG。之后,通过仿真实验,验证了(k,△)-匿名模型与UPG算法的有效性。最后,对全文内容进行归纳总结,并指出本文研究工作中存在不足及未来的研究方向。
其他文献
随着我国经济的快速发展,对煤炭的需求也越来越大。而煤炭行业是诸多能源行业当中的高危行业,其开采一直受到很多条件的限制,其中地下水是威胁煤矿安全生产的重要因素。最近,多起
苹果公司在Macworld 2007上发布的智能手机iPhone是多媒体与通信技术迅速发展带给我们生活美好礼物的一个典型例子,然而与之相对应的是当手持设备越来越像一个智能娱乐计算机
随着计算机网络技术的发展,信息系统的安全性问题变得越来越重要。数字签名作为一种具有消息完整性认证、可鉴别性、抗抵赖性和加密功能的技术在计算机网络安全通信中占有重要
聚类分析作为一种重要的非指导学习方法,在多媒体数据管理中得到越来越多的应用,如对图像进行聚类预处理,有助于发现图像之间的语义相似性、减少检索代价等。但是,由于图像语义与
随着计算机技术的飞速发展,身份认证已经成为一个十分重要的研究课题。本文对现有的身份认证机制及技术进行了分析和研究,利用PAM(可插拔认证模块)和安全U盘技术,设计开发了基于
随着Internet基础架构的发展以及音视频压缩技术的进步,基于Internet的流媒体信息交互平台受到了越来越广泛的重视。目前,利用流媒体技术进行远程网络教学已经逐渐成为流媒体
随着虚拟现实技术的发展,面对越来越复杂的场景模型和有限的图形绘制处理能力,为了提高实时绘制速度,满足交互式应用需求,研究人员探究出一些在图像真实度和帧速率之间折衷的方法
作为一个广泛分布的全球信息服务中心,万维网集中了海量的信息,其中大多数是以网页文本的形式存放的。这些文本信息种类繁杂,缺乏组织,现有的以搜索引擎为代表的网络信息系统
指导教师签字:随着全球信息化时代的到来,由于数字媒体所具有的易传播、易复制等特征,使得知识产权得不到有效的保护,这将严重影响该领域的健康发展。因此,版权保护是一个迫切需要
随着很多基于位置服务的兴起,位置预测发展成了一项必要的任务,比如,通过预测用户的目的地,向用户推荐旅游景点的信息,或者发布一些超市、商场的折扣信息等。位置预测就是根