一种基于K-匿名的隐私保护算法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:xianxing599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据发布为数据交换和数据共享提供了便利,但是数据发布的同时,个人隐私信息泄漏的问题也日益突出,隐私保护已成为数据库安全领域面临的一个新挑战。K-匿名作为数据发布中保护个人隐私的一种重要方法受到了广泛的关注。本文对K-匿名技术进行深入研究,为了更好的平衡隐私保护与匿名数据可用性之间的矛盾问题,提出一种新的匿名模型及算法,主要研究内容如下。本文针对现有K-匿名过程中没有充分考虑敏感属性的隐私保护度问题,提出一种基于敏感属性隐私保护度分组的(p,α)-Sensitive K-匿名隐私保护模型。该模型首先对不同的敏感属性值进行分析,根据敏感属性的隐私保护度划分成不同的组,然后为各个敏感属性组设置不同的组隐私泄漏率,这样不仅可以对隐私保护度相同的敏感属性提供同样的保护,而且也可以对分组中高敏感性的属性值提供更强的保护。同时,本文对当前匿名泛化算法的不足进行分析,结合聚类和泛化的方法实现了(p,α)-Sensitive K-匿名模型,聚类的过程中使每个类中的元组尽可能的相似,并给出相关的距离定义、信息损失计算公式以及实现该模型的聚类泛化算法。本文利用经典Adult数据集对该模型进行验证,从算法的执行时间和信息损失两方面进行分析。实验结果表明,本文提出的解决方案不仅能有效地保护高敏感性的隐私信息,降低了隐私泄漏的风险,还能减少数据匿名化处理所带来的信息损失,提高了数据的质量。
其他文献
随着视频点播服务的流行,对VOD系统的大规模分发需求也越来越高。传统的CDN架构VOD系统的部署和维护费用相对较高,而且它的单一服务器的负载有限,系统的扩展性难以满足发展的
近年来,随着信息技术的快速发展与网络的广泛普及化,数据形式变得更加多样化,传统的静态挖掘技术无法适应快速流动的动态数据的挖掘,数据挖掘的研究向着更深入的方向发展。其
随着基于位置服务相关技术的成熟以及普及,定位应用已为人们的日常生活提供了极大的便利,市场对于定位需求和精准度要求与日俱增。在室外定位方面,卫星定位技术完善且广泛运用,如
对于通信系统的建模存在很多种方法,其中以面向对象方法建模和Petri网建模为主要建模方法。面向对象建模广泛采用UML建模,作为一种半结构半形式化的建模语言,不能提供严谨的
随着Internet规模的日益扩大,各种网络业务不断涌现,网络应用的数据流迅猛增长,网络设备原本单一的“尽力”服务方式已不能满足要求。这一切对各种网络设备提出了新的要求,需
人体识别问题(person re-identification)就是在非重叠的多摄像系统中判断一个摄像头下出现的行人是否与另一个摄像头下出现的行人为同一行人,其在目标提取以及跟踪等领域发挥着
随着互联网技术的日益发展和普及,中文问答社区如知乎、百度知道等正逐渐成为一种广受用户喜爱的信息分享与获取平台。用户可以在其中以提问或者是查询相似问题的形式从其他用
随着科学技术的快速发展,各类数据的存储量与日俱增,对于这些海量数据的挖掘需求越来越强烈,因此大规模单图下的频繁子图挖掘也随之成为研究热点。频繁子图的目标是从图集或者单
DNA指纹图谱是通过实验使不同大小的DNA片断在凝胶底板上分离并显影而得到的图像。DNA指纹图谱首先在法医、亲子鉴定及遇难人员身份确定等社会领域得到应用。随后,当生物学家
弥散张量成像是20世纪90年代出现的一种新型的磁共振功能成像技术。弥散张量成像通过测量组织内水分子的弥散特性,获得水分子弥散的方向、量级和各向异性等信息,进而探测出组