支持安全数据发布的K-匿名技术的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:ailynn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今科技和信息紧密联系的时代,大量的信息以数据发布的形式实现彼此的信息共享。从安全角度考虑常常需要对其中的敏感信息加以隐藏,因此面向数据发布的支持隐私保护的数据安全技术越来越受到人们的重视。数据安全中的K-匿名化技术是保护数据隐私的重要途径之一。当前K-匿名化方法主要通过全域概括来实现发布数据的K-匿名化处理,该方法效率低,并且具有很大的信息损失。此外,已有的K-匿名算法没有考虑多约束的情况。针对以上问题,重点研究基于不同匿名约束的K-匿名化技术。 分析了匿名化约束和K-匿名化方法的特点,针对单约束和多约束,分别提出了不同的K-匿名化方法。对于单约束,提出了基于元组概括过滤思想的单约束K-匿名化算法Classfly,即在K-匿名化过程中符合约束的元组不需参与进一步的概括,从而提高了K-匿名化的精度和处理效率。 针对多约束,提出了基于联合约束K-匿名化相应元组子集的post-Classfly算法和基于概括过滤最大匿名元组子集的NM-Classfly和FTB-Classfly算法。在NM-Classfly和FTB-Classfly算法的K-匿名化过程中,符合独立约束子集的最大匿名元组子集不参与进一步的概括,从而提高了多约束K-匿名化后的数据精度和执行效率。提出一种数据结构频繁表(Frequent Table),使得与NM-Classfly算法相比,FTB-Classfly算法在获得相同精度发布数据的同时具有更高的执行效率。进而,提出低选择度约束优先(PCLS)原则,可以更好地改善FTB-Classfly和NM-Classfly算法的效率。 大量实验和分析表明,提出的K-匿名化技术在信息损失和处理效率方面均优于现有的K-匿名方法。单约束K-匿名化算法Classny不论在执行时间还是K-匿名化后数据的精度上都优于Datafly算法。在多约束K-匿名中,NM-Classfly和FTB-Classfly算法的精度是最大的。另外,采用频繁表有效地提高了多约束K-匿名化的执行效率。实验还验证了低选择度约束优先(PCLS)原则的有效性。
其他文献
学位
近年来,随着多媒体技术和计算机网络的飞速发展,多媒体数据,特别是图像数据,正在以前所未有的速度呈倍增长。如何有效的管理与检索图像数据已成为目前信息检索领域中的重要课题。
众所周知,VoIP 可谓语音通信的未来。电信运营商宣称 IP 电话在语音通信时间中所占比例正在快速增长,由其带来的大量新兴电话服务已经得到运用。随着数据业务的迅速发展以及网
安全问题是信息化建设过程中不可回避的话题,在现代信息社会中,随着计算机技术的广泛应用,这一问题也就显得更加迫切。目前安全领域的技术门槛高、投入代价大、易用性差、互操作
近年来,随着无线应用需求和市场的不断增长,无线应用业务和WAP设备得到了不断的发展,手机上网开始日益流行。然而,由于移动设备使用的通信协议和标记语言与互联网中所使用的
备份集是对数据进行备份产生的数据集合。备份集的管理是数据备份系统中的一个不可或缺的部分。备份集管理的好坏直接关系到整个系统的性能,关系到备份集的有效使用,关系到介质
复合盘技术充分融合了硬盘的容量大和FLASH的速度快,功耗低的特性。对于移动计算设备来说,电池使用时间太短是一个致命的问题,而复合盘的低功耗能很好的解决这一问题。同时它
随着嵌入式系统的规模、复杂程度和可靠性需求的不断提升,模型驱动的体系结构开发方法已经成为复杂嵌入式系统开发的主流。体系结构分析与设计语言AADL(ArchitectureAnalysisan
随着互联网技术的迅速发展,网上信息飞速增长。如何从这些海量信息中检索出所需要的相关信息已成为一个非常重要的研究课题。而由于用户用词歧义以及查询条件表达不完整等现
人体姿态估计是计算机视觉领域中一个比较热门的研究问题。在本课题中,我们主要讨论静态图像中的人体姿态估计问题。我们在混合部件模型的基础上做出一些扩展,提出了一种更合理