关联规则挖掘算法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:atmip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和人们获取数据手段的多样化,人类拥有的数据量飞速增加,并且面临着数据丰富而知识贫乏的窘境,数据挖掘技术使人类摆脱了这一困局。数据挖掘有效地融合了数据库、人工智能、数理统计、机器学习和模式识别等多种学科,可以从大量的、有噪音的数据中提取隐含在其中的、事先未知的、数据拥有者可以理解的和潜在有用的信息和知识,在零售业、电信业、金融业等领域有着广泛的应用。关联规则挖掘是目前数据挖掘领域中研究最为广泛的课题之一。自1993年Agrawal R.等人提出了关联规则问题起,诸多学者对该问题进行了大量研究,并提出了很多新算法。本文在对关联规则挖掘问题研究和总结的基础上,对关联规则经血Apriori算法进行了详细的阐述和分析。基于Apriori算法的不足,提出了关联规则更新问题,并将更新问题分为阈值动态调整和数据库动态更新两类,对于每类更新问题分别给出了更新算法,其中详细介绍了FUP算法和PFUP算法。考虑到数据库更新包括数据删减和数据增加两种情况,给出了一种新的更新算法,同时该算法在PFUP算法的基础上还提出了频繁新项集的概念,大大拓展了算法的使用范围。由于上述算法都是基于Apriori算法的,而Apriori算法多次扫描数据库和产生大量候选项这两项缺点严重影响了算法的效率,本文在ABM和ABBM算法的基础上,提出了基于矩阵的关联规则算法,其中设置了中介矩阵,为更好解决更新问题提供了基础。最后,综合前面几章的内容,给出了基于矩阵的关联规则更新算法。该算法彻底摆脱了Apriori算法模式的窠臼,同时考虑到更新问题的两种情形,不需扫描原数据库,只需扫描发生更新的数据库部分,实现了关联规则高效更新。
其他文献
随着科学的快速发展,社会的不断进步,在科学研究和实际工程中遇到的问题也日益复杂化,优化问题便是生产实践中经常碰到的一类问题。在解决优化问题时,往往存在维度高、计算量
无线传感器网络(WSN)是一种依赖传感器节点进行区域监测,并且以无线数据传输的方式进行数据传输的新型网络。由于传感器节点自身携带的能源有限,并且通常被撒布于无法在部署
随着信息科学的迅猛发展,智能化工具逐渐走进人们的生活,人们越来越渴望实现人机之间的交互,并且希望达到更加自然的水平。语音识别正是实现人机交互的途径之一,并且已经在诸多行
从结构设计和方法优化入手,提出了基于双SRAM缓存结构并采用乒乓读写原理的CMOS图像传感器逐行转隔行数据缓存方法。该方法采用两组SRAM作为缓存,并利用乒乓读写原理,抽取逐
随着知识经济时代的到来,企业之间的竞争日趋激烈。在企业进行激烈竞争的过程中,研究与开发(R&D)活动成为企业与其主要竞争对手争夺地位的关键性因素。由于市场是千变万化,神奇莫测的,市场的灵敏反应造成企业时刻要进行技术创新,再加上经济全球化的趋势,使得更新、更适用的技术和工艺层出不穷,每一种新技术的出现都会给企业带来新的市场机会,技术的迅速变化迫使企业对R&D项目要有充足的投入。而由于R&D具有高不确
断裂理论是固体力学的一个核心理论。用断裂理论对裂纹的失稳进行预判对于材料能否正常使用是有帮助的。本文总共分为五部份,其中第三、四部分为论文的核心内容。本文对工程中
曲线骨架的提取在计算机图形学和可视化领域的许多应用中是一个比较基本的问题。曲线骨架是三维模型的一维表示。它广泛地应用在计算机动画、虚拟导航、分割、形状匹配等领域
变分不等式及单调算子零点问题的投影算法对模型中的映射要求的假设条件与其它算法相比是最弱的,投影算法里面的一个重要程序是计算点到集合的投影,在实际计算中,投影的计算