面向共享的数据隐私保护匿名方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:helinjue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息技术的高速发展以及数据挖掘等技术对服务人们社会生活所起到的作用越来越显著,数据共享作为一种数据来源对政府部门、商业机构和研究机构从事各种目的的研究的重要性不容置疑。数据共享给用户提供便利的同时,对个体数据隐私保护就显得非常的重要。k-匿名模型是一种保护个体隐私信息的经典方法,由于对共享数据安全的要求越来越严格,近年来出于增强数据安全方面的目的,对这种数据隐私匿名保护方法进行改进和优化显得十分重要。本文在研究当前共享数据匿名隐私保护方法的基础上,针对k-匿名模型很少考虑到的敏感属性值与准标识符属性之间的依赖关系造成的麻烦,结合敏感属性值多样性和敏感程度保护程度不同等实际需求,基于本文给出了诸多的约束规则,提出了一种(d,α)k-匿名模型。该方法通过结合依赖约束规则和非关联规则,以保护数据发布后的共享数据不受属性之间依赖关系而泄露个体身份,防止共享的有用信息被过度修改,合理的增强敏感属性值多样性以及约束高敏感属性值的分布。本文针对减少信息损失以及当前匿名泛化算法在处理分类型数据上的不足,将距离聚类算法引用到(d,α)k-匿名模型中,通过计算每条记录之间的距离,确保每个类中准标识符属性值尽可能的相似,以避免出现传统全域泛化和局域泛化存在的灵活性差、过度泛化和信息损失量大等问题。最后进行仿真实验,结果表明该方法在保护个体隐私信息的前提下,减少了因为数据匿名化所产生的信息损失。
其他文献
随着互联网的迅速发展,网络上的信息成爆炸式增长。自从Tim Berners-Lee提出Web2.0的概念之后,用户从被动的接受信息逐渐转变成信息发布的参与者。社会标签是Web2.0的众多应用
随着计算机网络技术的发展,为了满足视频点播、网络会议、网络实时游戏等多媒体应用这些当今因特网的主流业务,急需建立一种高效的、有QoS保障的数据通信机制。建立这种机制主
近年来,不确定数据的管理吸引了来自工业界和学术界的极大关注,特别在诸如无线传感器网络、生物技术和生物数据库、基于位置的服务和数据流等新兴的领域中。为了准确获取不确定
数据挖掘是指从分散的异构信息中获取知识的过程,其直接目的是快速检索有用信息,将数据挖掘与Web结合形成的Web信息挖掘是处理海量Web信息的有效手段。虽然Web信息挖掘能极大
时空数据库技术是计算机科学的新兴领域。由于时空数据库本身的一些特性,所以被广泛应用到多种领域。本文重点比较了适用于网络中移动对象轨迹查询的索引结构,提出了一种适用于
当今计算机技术的发展日新月异,软件在我们的生活中扮演着水和电的重要角色。C语言作为一门广泛应用的语言,已有40多年的历史,它在系统软件如操作系统、编译器、数据库等领域
联机事务处理是数据库领域的重要应用。随着近年来电子商务的迅猛发展和企业数据量的激增,用户对数据库事务处理能力提出了越来越高的要求,而处理器技术和内存技术的发展也为
随着网络普及和技术的发展,人们的日常生活中对互联网的依赖性越来越高。普通公众更多地选择通过网上交易实现购物,而政府机构也大力倡导电子政务和电子贸易。当大量用户使用网
最小生成树问题是一类经典的网络优化问题。大量研究表明,最小生成树结构是通信网络设计的最优拓扑。生成树在大多数网络设计和分析问题中扮演着重要角色,然而,实际的网络优化问
在现实世界中,网络随处可见。如全球交通网络、因特网、生物系统中的新陈代谢网络、科学家合作网络、生态网络和在线社区网络等。网络中存在着大量的社区结构,而对网络进行社区