数据发布中数值型敏感属性的隐私保护研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:snowtea1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,学术界针对数据发布中的隐私保护问题已经提出了许多模型和算法,这些模型和算法在不同程度上解决了数据发布中的隐私泄露问题。但是,现有的模型和算法主要是针对分类型敏感属性的隐私保护,而对数值型敏感属性的隐私保护研究很少,并且已有的针对分类型敏感属性隐私保护的模型和算法对数值型敏感属性的隐私保护并不适用。因此,本文在前人研究工作的基础上,对数值型敏感属性在静态发布和动态发布中出现的隐私泄露问题进行研究,并提出相应的隐私保护模型。本文的研究工作主要包括以下内容:   (1)针对数据静态发布中的近邻泄露问题,即:发布数值型敏感属性数据时,因同一等价类中个体的敏感属性值之间差异过小从而导致攻击者能够以较高的概率以及较小的误差推导出目标个体的敏感信息,本文提出一种防止近邻泄露的模型:(εp,l)-anonymity。该模型根据不同的敏感属性值区间设置不同的阈值εi(1≤i≤p)来控制敏感属性值之间的相似度,并采用有损连接的方法对隐私数据进行保护。模型(εp,l)-anonymity克服了传统隐私保护模型采用固定阈值控制敏感属性值之间的相似度的缺点,解决了传统模型因采用泛化的匿名技术所产生的信息可用性较低的问题。理论分析和实验结果均表明该方法可以明显减少近邻泄露,提高信息可用性,增强数据发布的安全性。   (2)针对数据动态发布中,由于不同发布时刻的数据表之间存在一定的关联,攻击者利用这种关联可能会推导出个体的隐私信息,导致隐私泄露的问题,本文提出一种适用于数据动态发布中数值型敏感属性的隐私保护模型——(α,m)-invariance。该模型针对数值型敏感属性具有可量化的特点,提出α相似性的概念,放宽m-不变性的约束条件,在添加伪元组之前,尽可能用新增元组代替已删元组,大大减少了伪元组的数目,而且模型采用的是泛化与有损连接相结合的匿名发布技术(ANGEL)。模型(α-m)-invariance有效克服了目前已有模型在解决数值型敏感属性的隐私保护问题产生的数据损失问题。理论分析和实验结果表明,本文提出的模型在保证良好的隐私保护效果的前提下,能有效提高信息可用性。
其他文献
随着3G技术的发展,越来越多的移动终端加入到了基于无线连接的Internet网络,而在传统固线连接的Internet网络中取得巨大成功的P2P技术与无线网络相结合,形成移动对等网(Mobile Pe
电容层析成像技术(Electrical Capacitance Tomography,ECT)可视为目前最为广泛研究的一种过程层析成像技术,该技术具有非侵入、非接触、成本低等优点,从原理上讲只要各相具有不
本课题从电能质量决策者的数据分析需求出发,针对传统的查询分析方式在电能质量数据分析过程中的局限性,提出了基于OLAP技术的电能质量智能信息系统多维分析解决方案,以更加
电子邮件给人们的生活和工作带来极大的便利,但大规模的垃圾邮件严重影响了邮件正常使用。垃圾邮件消耗大量网络资源,损害用户利益,还会被一些别有用心的人用来散播虚假消息,危害
现实世界是随着时间在发展变化的,时间是自然界的客观属性,是信息的重要组成部分。随着计算机科学和信息技术的不断发展,传统的DBMS已经无法实现对时态信息的处理,因此时态数
随着传感器技术、微电子系统、现代网络和无线通信技术的飞速发展和日益成熟,无线传感器网络(Wireless Sensor Network,WSN)逐渐被应用于国防军事、智能建筑、国家安全、环境
聚类分析一直是数据挖掘和知识发现领域最重要的研究方向之一,聚类技术也得到了越来越多的关注,并且广泛应用于工程、生物医药、市场营销、商业智能与决策分析等诸多领域,切
音乐具有情感,有的情感比较单一,有的情感可能比较丰富;由于主观因素的存在,每个听众对每首音乐具有的情感的标定也是不一的,这就对情感定义和情感库的建立带来难度。本文以音乐情
电力调度自动化系统作为电力系统运行调度与控制的大脑,用于实现对电力系统在线计算机控制与调度决策,其在电力系统中的作用日益显著。目前,我国正在大力进行智能电网建设,智能调度是智能电网发展的必然趋势,而智能调度的基础是电网调度自动化系统。因此,必须加强身份认证技术和访问控制机制,来保障电力调度自动化系统的安全。在身份认证方面,本文针对调度自动化系统存在身份冒充的问题,提出了一种新的双因子的双向身份认证
将互联网上海量的非结构化文本数据转为应用所需的结构化知识,使其可被计算机高效地利用是改进搜索系统,实现智能问答与机器阅读的基础。在这个过程中,实体链接技术扮演了一