关联规则挖掘中隐私保护技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:zy19870912zy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是从大量数据集中挖掘出潜在的知识,这就可能把涉及到个人隐私的信息挖掘出来,从而产生了隐私保护下的关联规则挖掘。因而,如何在关联规则挖掘的过程中解决好隐私保护已成为数据挖掘研究领域中的一个迫切需要解决的关键问题。虽然传统的隐私保护技术在一些领域已经得到了一定程度的认可,但是随着时代的进步和科学技术的不断发展,人们对隐私保护对象以及隐私保护技术提出了更高的要求,这意味着需要研究新的隐私保护方法来满足人们的这些需求,因此,本项目的研究具有重要的理论意义和广泛的应用前景。   论文介绍了关联规则挖掘中隐私保护的国内外研究现状和基本知识,重点对数据库中的隐私数据保护和敏感规则的保护问题进行了研究,提出了一种基于数据交换技术的隐私数据保护方法,提高了隐私数据的隐私性和对变换后的数据库进行规则提取的有效性。根据遗传算法的思想和特点,提出了一种基于遗传算法的敏感规则隐私保护算法,不仅能够有效将全部敏感规则隐藏起来,而且对数据库产生的副作用较小。   论文的主要研究成果包括以下几个方面:   1、介绍了关联规则挖掘中隐私保护的相关知识,对典型的隐私保护算法进行了分析介绍。   2、提出了一种基于数据交换技术的隐私数据保护算法APPDARM,给出了算法的思想和流程,并通过实验对该方法进行验证。实验结果表明APPDARM方法能够有效保护数据库中的隐私数据,并提高了对修改后的数据库进行规则提取的有效性。   3、结合遗传算法思想,提出了一种基于遗传算法的敏感规则隐私保护算法GASRP,给出了算法的流程和具体的操作过程。通过实验验证,算法GASRP不仅能够有效将敏感规则进行隐藏,而且对非敏感规则丢失以及虚假规则的产生影响都较小。   4、以APPDARM算法和GASRP算法为基础,使用C++语言,设计并实现了一个基于隐私保护的关联规则挖掘原型系统。  
其他文献
20世纪以来,不确定性的科学价值和现实意义逐渐被人们所接受。学者们通过对概率论、模糊集理论以及近年来发展起来的粗糙集理论的应用,使得不确定性问题的研究取得了很大进展,其
认知图是一种软计算工具,是近年来兴起的一种新的知识管理方法和知识表达工具,它可以用来表示相关领域中实体之间的因果关系。认知图推理就是在认知图的基础上,利用已知的知
图像中包括哪些类别的对象?对象的具体位置在哪里?每一类的对象有几个?对象有什么姿势动作?它们之间的关系又是怎样?如果让人们回答这些问题,是一件很容易的事情。但普遍意义
当今信息存储对于各行业的重要性日益明显,对存储软硬件的容量增长、可靠性和高效性等都提出了新的要求和挑战。在信息存储领域,磁盘阵列技术从产生起就一直发挥着重要的作用
中文信息处理技术在当代有广泛的应用。随着互联网和计算机应用技术的快速发展,大量数据向中文信息检索、处理提出新的课题和需求。本文在计算语言学及形式语义学的基础上:(1
计算机断层成像技术(Computed Tomography, CT)是与MRI、同位素扫描、超声图像等一样重要的医学图像诊断手段。与其他医学成像方法相比,CT成像具有检查方便、无痛苦无创伤、
随着数据库技术的成熟和知识发现等领域技术的不断发展,数据挖掘技术应运而生,并在越来越广阔的领域得到应用和发展。粗糙集方法是一种重要的数据挖掘方法,是由波兰科学家Z.P
随着Internet的不断发展,信息过载和资源迷向已经成为制约人们高效使用Internet信息的瓶颈。人们希望网页的内容能够尽可能地根据用户的浏览兴趣自动调整,从而使每个用户感觉
在计算机技术高速发展的信息时代,人们越来越多的学习、工作和生活都在依赖于计算机软件系统的正常运行,软件在现实社会中扮演着越来越重要的角色。但是现有的软件技术并不能
对等网络(P2P)产生的流量消耗了大量网络带宽资源,对网络运行造成了巨大压力,而且P2P流量快速增长导致跨ISP域流量不断增长,增加了ISP的运营开销,因此P2P跨域流量控制问题已