基于约束的不确定性数据关联规则挖掘算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:lingyumhg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着计算机软硬件技术的不断发展和应用范围的不断拓展,各个领域广泛出现了大量的不确定性数据。由于数据的不确定性,传统关联规则挖掘方法难以适用于不确定性数据。对不确定性数据进行挖掘算法的研究已经成为了数据挖掘领域的新热点。不确定性数据挖掘主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中关联规则挖掘是重点研究的问题之一。  绝大多数关联规则挖掘算法的整个挖掘过程缺乏用户的主动参与和控制,使用户无法根据挖掘进程和挖掘数据的特点来改变其参数或施加特定的约束,导致用户很难得到满意的结果。如果存在针对约束的关联规则挖掘算法进行挖掘处理会使整个挖掘过程更加快捷,也更具有针对性。经过研究与分析发现,目前对于不确定性数据关联规则挖掘算法的研究大都集中在挖掘完全频繁项集,而对基于约束的不确定性数据关联规则挖掘的研究尚不多见。因此,对基于约束的不确定性数据关联规则挖掘进行深入的研究具有重要的意义。  本文首先阐述了课题的研究背景和研究意义,概述了不确定性数据的产生原因和表现形式,讨论了不确定性数据关联规则挖掘的研究现状,然后对传统关联挖掘的经典算法进行了简要的介绍,重点讨论了不确定性数据中用于关联规则挖掘的U-Apriori,UF-growth算法,U-Eclat算法以及UH-mine算法。随后,本文分析和归纳了解决基于约束的不确定性数据关联规则挖掘的不同方案,并通过实例分析基于频繁模式树结构的U-FPS算法,详细介绍了该算法针对两种不同约束条件(反单调且简洁约束条件SAM和单调且简洁约束条件SUC)的实现过程和算法的优缺点。最后本文提出了基于约束条件的不确定性数据关联规则挖掘的US-Eclat算法,并通过实例详细介绍了该算法针对两种不同约束条件下的工作原理。US-Eclat算法是在Eclat算法的基础上提出来的,该算法仅需对原始数据库扫描一次,并充分利用了概念格对项集进行有效修剪,有效解决了基于约束条件的不确定性数据关联规则问题。经过实验将US-Eclat算法与U-Apriori和U-FPS进行性能比较得知,US-Eclat算法的性能和效率均有较大程度的提高,达到了优化算法目的。
其他文献
人工微结构材料是一种人工功能材料,具有自然材料所不具备的电磁特性,且其特性可视具体需求而人为设计。人工微结构材料的出现导致了全新的操控电磁波的技术和方法,大大拓展了传统的电磁学领域。围绕这一国际电磁学领域的研究热点,本文着重研究了人工微结构材料调控电磁波时空特性的机理,并探讨了其潜在的应用前景及实现方式。主要工作概括如下:第一,基于等效介质理论,首次给出了人工微结构材料的等效电磁参数收敛的厚度条件
无线传感器网络(Wireless Sensor Network,WSN)是对信息进行采集、处理并传输的信息监测网络。传统的WSN由于其对信息传输及计算处理能力已无法满足越来越高的应用要求,常常
目前的互联网应用已经进入了WEB2.0时代,互联网应用对于数据库的支持提出了更高的要求,总的来说,挑战来自两个方面,一者是数据规模越来越大,二是读少写多的操作特点。针对这
图像聚类与检索作为计算机视觉领域中高层语义理解层面下的两大研究方向具有广泛的应用价值。其主要研究方向集中于如何形成合理的图像特征表达和设计优化的推理求解算法。使
随着Internet技术的飞速发展,互联网上的信息呈指数级增长。庞大的数字化信息与人们获取所需信息的能力之间的矛盾日益突出,怎样快速准确地检索相关信息已经成为当今信息领域
由于社会网络的广泛传播性、动态性以及多样性,受到越来越多的用户欢迎,大量社会网络服务网站快速崛起。人们利用社会网络提供的服务,将自己的资源存放在平台上,进行信息分享
协同商务平台的环境复杂,涉及到的用户和资源数量多,对访问控制技术提出了更高的要求。针对大型协同商务平台中权限管理困难的问题以及对动态授权的需求,本文改进现有模型并
EPON (Ethernet Passive Optical Network,以太无源光网络)是一种新型的光纤接入网技术,它采用点到多点结构,在以太网之上提供多种业务。它综合了无源光网络(PassiveOptical Net
计算机大规模处理数据有多种方式,伴随着因特网的普及和云计算的高速发展,网络与计算机更紧密的结合在了一起。在庞大的网络环境中散布着大量的处理终端和服务器,发生错误或
面对互联网上海量的信息,个性化的定制服务逐渐成为人们获取信息的一个重要手段。其核心技术是如何对大量的用XML格式表示的数据进行快速而有效地处理。针对XML数据流,普遍采