基于隐私保护关联规则的挖掘算法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:s04325102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“大数据时代”的来临,数据挖掘广泛应用于社会生活、商企运营、科技研发等多个领域。“互联网+”的普及和数据存储技术的高速发展,也为海量数据的收集和管理提供了有力的技术支撑。通过对海量数据进行挖掘,可以从中发掘有社会和商业价值的知识。然而,被挖掘的数据中往往包含着许多敏感信息,给用户的隐私和数据安全带来了一定威胁。因此,研究如何将隐私保护和数据挖掘有机结合,在保护敏感数据的同时,实现精确高效地挖掘,目前已成为数据挖掘研究领域的热门方向。本文主要研究内容为基于隐私保护关联规则的挖掘算法,重点针对面向集中式分布数据的隐私保护关联规则挖掘算法AOPAM进行分析和改进。文中首先介绍了相关背景知识,对传统的典型算法进行分析,详细阐述了算法原理并提出了算法的综合评估标准。接着,着重分析了基于部分隐藏转移概率矩阵的AOPAM算法,针对算法在时间复杂度和时间效率上的不足,本文提出了两个优化策略对其加以改进:其一,采用矩阵的分治和递推思维简化高阶逆矩阵的求解;其二,利用集合运算原理加快项集的计数。通过优化频繁项集重构过程来降低算法的时间复杂度,提高运行效率。最后,通过具体实验与分析,验证了提出的改进策略在优化时间效率方面的有效性。本文主要研究工作如下:(1)对概率矩阵求逆过程进行改进。原算法在项集支持度重构过程中,需根据初等变换法则对2~N×2~N阶矩阵求逆,时间复杂度高,运行效率低。本文提出的改进算法从分治和递推思维出发,根据各阶矩阵间的递推规律,用N-1项集的概率逆矩阵递推得到N项集的对应逆矩阵,避免了对每个矩阵进行冗长复杂的初等变换求逆运算,使得算法在高阶矩阵求逆过程中具有更高的运行效率。(2)对项集支持度计数的流程进行优化。原算法需要频繁扫描数据库,对2~N种N项集循环计数,步骤繁杂冗长。本文改进算法根据集合容斥原理,利用已知项求解未知项,在同样的项集支持度计数过程中只需扫描N次数据库。改进后的算法简化了项集计数流程,提高了算法运行效率;(3)实验验证。从算法的运行时间、隐私保护系数和一致性误差三方面对改进后的算法进行比较分析,验证了算法的有效性。
其他文献
作为一种毁灭性土传的病害,由尖孢镰刀菌古巴专化型4号生理小种(Fusarium oxysprum f.sp.cubenserace4,FOC4)引起的香蕉枯萎病已在广西部分香蕉产区零星发生,正处于病原菌菌
密排六方结构的稀有轻金属铍(Be)作为一种特殊的结构功能材料,在核能、航空航天等领域有着重要的应用前景,如用于聚变堆第一壁材料、惯性导航器件等。金属铍具有众多独特优异
火灾是当今国内外发生频率高、危害比较大的的灾害之一,它的存在严重威胁了人类的的生命财产安全,也造成了整个社会的经济损失。所以及时、准确的检测到火灾的发生是一件对社
地震是人类已知的最为严重的突发性自然灾害之一,地震发生时伴随着巨大的能量释放,给人类带来严峻的生命威胁和巨大的经济损失。近场地震区域距离地震断层破裂带较近,地震能
流量控制在保证网络关键业务服务质量方面起到了重要作用。但随着网络带宽和网络流量的日益增加、新业务的不断涌现和发展,流量控制面临着更复杂的问题和更高的挑战。本文研
随着经济的快速增长,数据量快速增加,越来越多的数据处理技术随之出现,例如数据收集、存储等。然而当企业决策人员希望使用这些海量数据为他们的商业决策提供支持时,却经常由
随着建筑技术的发展和人们生活水平需求的提高,大跨度建筑越来越多的出现在人们的生活中。如随着钢结构技术的发展,新建的高铁站大多采用的是大跨度钢结构建筑。这给人们带来
目的:1.通过临床随机对照实验,观察蒙医拔罐放血疗法结合蒙药治疗腰椎间盘突出症的临床疗效观察,并客观评价拔罐放血疗法结合蒙药治疗腰椎间盘突出症的临床疗效,初步阐明其治疗原则,为临床提供参考。方法:符合纳入标准的92例患者,随机分为观察组,对照组Ⅰ,对照组Ⅱ。观察组30例患者运用蒙医拔罐放血疗法结合蒙药嘎日迪-13为主药,辩证施治。对照组Ⅰ 31例患者用蒙医针刺疗法,对照组Ⅱ 31例患者用蒙医拔罐放
本文通过薄层层析,HLPC检测方法,对不同部位虎眼万年青总皂苷的提取得率进行了对比,实验确定从虎眼万年青的球茎部分提取虎眼万年青总皂苷成分最多,其得率也最高,为0.98%,叶,
随着计算机网络技术的发展,人们正经历着一个生活方式发生变化的年代。伴随着Web2.0走向前台,社交网络蓬勃发展。社交网络具有一个重要的结构特点—“社区结构”,即网络是由