面向分类挖掘的独立L-多样性隐私保护方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:as7770420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展与普及,大量个人信息被发布以用于数据挖掘,这些信息在为各行业提供知识及商业价值的同时,也给个人隐私信息的安全造成了威胁。因此,研究新的、实用的隐私保护技术具有重要的意义。对于现有的面向分类挖掘的隐私保护技术存在安全性不足的问题,和现有的满足独立L-多样性原则的隐私保护技术不适用于分类挖掘应用的问题,首先,给出了面向分类挖掘的独立L-多样性隐私保护算法,算法分为三个操作步骤:初始化操作是为不同类型非隐私属性生成语义树,并对相应语义树进行初始化以提高算法效率,划分操作是基于Top-Down Specialization算法中自顶向下的泛化思想的两层划分,在划分操作中的划分节点选取操作,使得划分后的匿名数据可以获得较大的信息增益并降低泛化带来的信息损失,使匿名数据可用于分类挖掘,同时,在第一层划分后为分组内每个元组添加L-1个互不相同的噪音隐私属性值,扰动操作使匿名后的数据满足独立L-多样性原则;其次,对给出的算法在安全性、可用性与代价上的分析,理论上证明了经算法匿名后的数据满足分类挖掘的要求,且满足独立L-多样性原则;最后,给出了算法的特性实验、分类挖掘相关算法与现有工作的对比实验,实验结果表明,匿名后的数据可用于分类挖掘,同时有较好的分类效果。
其他文献
目前,故障诊断已经发展到了智能阶段,而智能故障诊断技术的研究重点已经逐渐由传统的人工智能转向新兴的计算智能领域。计算智能领域的一些理论,如人工神经网络,粗糙集理论等
诗歌作为一种特殊的文学体裁,其计算机模拟生成被视为自然语言生成领域的一大挑战。本文以汉语古典诗词为研究对象,对机器自动生成宋词的可能性和具体实现方法进行了详细的研
随着移动互联网的飞速发展,智能终端性能得到显著提升,但对爆发式增长的移动应用而言,其计算和电池续航能力均显不足,将终端任务迁移到资源丰富的云端执行的代码迁移技术成为
随着Internet的发展和接入主机数量的增多,人们对服务器的性能要求越来越高。高性能性、高可用性、高伸缩性和高安全性正成为衡量一台服务器性能的标准,然而单台服务器远远达不
现实世界中的很多问题如信号传输,投资方案选择,编码错误诊断等都可以抽象为最大团问题(MCP,Maximum Clique Problem),此外,最大团问题在模式识别,计算机视觉等领域均有应用。
需求跟踪是大型复杂软件开发的一个重要部分,为软件工程的许多活动提供有力的支持:它有助于确认系统的需求是否得到实现;加深对软件制品的发展过程的理解;提高对系统设计和实现的
数据拥有者将敏感数据以密文形式外包到云服务器,用于多个用户多地共享访问。因此,在云环境下,维护密文数据的安全性和支持多用户在不同的访问权限下的高效查询是外包数据多
近年来,由于互联网的广泛普及和宽带网络的高速发展,对网络带宽要求较高的网络多媒体技术也发展迅猛,其中基于流媒体技术的相关开发与应用成为当前热点之一。传统的流媒体系统几
随着互联网技术的飞速发展,网络安全变得日益重要。远程监控不仅是一个国家对抗敌对政治势力,打击网络犯罪分子的重要手段,而且是未来网络战争中不可或缺的组成部分。程序的
QoS(Quality of Service)即服务质量是一个综合指标,用于衡量使用一个服务的满意程度。随着网络的普及发展以及网络数据传输量的迅猛增长[1],如何实现端到端的QoS成为一个棘手