论文部分内容阅读
关联规则挖掘是从大量数据集中挖掘出潜在的知识,这就可能把涉及到个人隐私的信息挖掘出来,从而产生了隐私保护下的关联规则挖掘。因而,如何在关联规则挖掘的过程中解决好隐私保护已成为数据挖掘研究领域中的一个迫切需要解决的关键问题。虽然传统的隐私保护技术在一些领域已经得到了一定程度的认可,但是随着时代的进步和科学技术的不断发展,人们对隐私保护对象以及隐私保护技术提出了更高的要求,这意味着需要研究新的隐私保护方法来满足人们的这些需求,因此,本项目的研究具有重要的理论意义和广泛的应用前景。
论文介绍了关联规则挖掘中隐私保护的国内外研究现状和基本知识,重点对数据库中的隐私数据保护和敏感规则的保护问题进行了研究,提出了一种基于数据交换技术的隐私数据保护方法,提高了隐私数据的隐私性和对变换后的数据库进行规则提取的有效性。根据遗传算法的思想和特点,提出了一种基于遗传算法的敏感规则隐私保护算法,不仅能够有效将全部敏感规则隐藏起来,而且对数据库产生的副作用较小。
论文的主要研究成果包括以下几个方面:
1、介绍了关联规则挖掘中隐私保护的相关知识,对典型的隐私保护算法进行了分析介绍。
2、提出了一种基于数据交换技术的隐私数据保护算法APPDARM,给出了算法的思想和流程,并通过实验对该方法进行验证。实验结果表明APPDARM方法能够有效保护数据库中的隐私数据,并提高了对修改后的数据库进行规则提取的有效性。
3、结合遗传算法思想,提出了一种基于遗传算法的敏感规则隐私保护算法GASRP,给出了算法的流程和具体的操作过程。通过实验验证,算法GASRP不仅能够有效将敏感规则进行隐藏,而且对非敏感规则丢失以及虚假规则的产生影响都较小。
4、以APPDARM算法和GASRP算法为基础,使用C++语言,设计并实现了一个基于隐私保护的关联规则挖掘原型系统。