基于敏感属性数据发布的隐私保护方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:asdfghjkg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络信息时代的飞跃发展下,数据发布使数据挖掘和信息共享变得更加便捷,然而数据发布在为各行各业的人士提供方便的同时也伴随着大量敏感数据泄露问题。如何让发布的数据既有较高可用性又能保护这些敏感信息不被泄露,这个问题已成为数据发布隐私保护领域的重要课题。本文重点对敏感属性数据发布的隐私保护方法进行研究。主要工作和创新如下:(1)数据发布中隐私保护模型和隐私攻击方式研究:首先,分析引起隐私数据泄露的常见攻击方式并通过例子进行阐述。然后研究现有的典型隐私保护模型和应用场景,并分析这些模型的优缺点。此外,总结了隐私保护方法中信息度量的相关原则。(2)单维敏感属性(SSA)隐私保护方法研究:在数据发布中,针对相似性攻击造成的单维敏感属性隐私泄露问题,本文给出了面向敏感值和敏感程度同时保护的(SD,K)-anonymity模型。该模型引入敏感属性测度的概念,结合分类树知识对敏感属性进行敏感程度衡量。将敏感值之间的相似程度进行量化,通过量化值实现敏感属性程度划分,最终使等价类中属性值不仅含有敏感值的多样性还包括敏感程度的多样性。另外,根据该模型设计对应算法。通过仿真实验分析得出:本文提出的单维敏感属性保护模型可以有效减少敏感程度攻击记录次数,降低隐私泄露风险,平衡了少量信息损失和执行时间问题,更好地保护用户的敏感属性。(3)多维敏感属性(MSA)隐私保护方法研究:针对多维敏感属性之间映射关系产生的连锁攻击泄露问题,本文给出了主敏感属性半约束(LI,L2)-diversity模型,该模型引入统计学思想,对等价类中主敏感属性对应的敏感值进行统计发布,以此切断与其他维敏感属性的一一对应关系,同时结合多维桶思想提出主敏感属性候选集,设计出改进的实现算法MP+HC(L1,L2)-diversity。经过试验表明,该算法与多维桶分组算法相比较,隐匿率较低,时间消耗方面有少量增加。整体上,该模型在牺牲较少时间的情况下有效保护了多敏感属性隐私信息,并提高了数据有效性。(4)面向电子病历匿名化数据系统的设计:针对电子病历数据存在的隐私安全问题,以本文提出的算法为基础,初步设计了面向电子病历匿名化数据发布系统。
其他文献
保障义务教育公平是社会公平的重要基础,义务教育在省际间均衡发展是义务教育公平的应有之义。本研究综合运用变异系数法、基尼系数法、泰尔指数法等计算方法,对我国省际维度
站在近代这样的时代峰颠上 ,王国维作为近代著名的学者 ,在他的学术中已经透露出了现代的气息。在美学思想上 ,王国维一反中国传统的“功用”主义思想观 ,提出了他著名的“非
谷胱甘肽是广泛存在于生物体内的一个含有γ-肽键的生物活性三肽,其中游离的巯基是其活性中心。在生物体内谷胱甘肽主要是由GSH I和GSH II两个酶依次催化合成,而GSH I和GSH I
本文成功探索出了给电子体9,9-双(甲氧甲基)芴的新合成方法。采用芴、碱和氯甲醚为原料,制备了中间体9,9-芴基二锂并完成了中间体的烷基化,最终合成了目标产物9,9-双(甲氧甲
光伏电站天空图像中云团运动速度的快速准确计算是进行光伏功率分钟级超短期预测的前提基础。针对目前采用图像分割匹配计算方法耗时较长的缺点,基于分钟级时间尺度下相邻天
本文首先分析了输油管道的运行环境和油品泄露可能造成的危害,即随着输油管道规模的日益扩大和油气田开发的不断进行,新旧管线并存。由于自然腐蚀、意外破坏、操作失误、偷盗油
目的:探讨补中益气汤加减联合司来吉兰治疗帕金森病伴功能性便秘的临床疗效及安全性。方法:选择本病患者124例,根据治疗方式不同分成治疗组和对照组,两组均常规应用复方多巴
当代中国,大众传媒凭借其先进的传播手段深刻影响着社会的各个领域,人们在享受媒体带来的便利的同时,也感受到媒体不适当地参与司法审判所带来的负面影响。在大力提倡媒体发
目的:对红藤的研究概况进行综述。方法:查阅文献,并对文献资料加以归纳、分析。结果:红藤含有多种化学成分,具有抗菌、抗炎、抗病毒、抗肿瘤、抗辐射、抗过敏等作用,在临床应
在 2 0世纪 3 0年中期 ,美国总统福兰克林·罗斯福针对当时的经济大危机带来的剧烈社会动荡 ,签署了由国会通过的《社会保障法》 ,美国开始实行由政府主导的社会保障制度。本