面向不确定数据流的频繁模式挖掘算法研究

被引量 : 0次 | 上传用户:liucrobin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式挖掘旨在通过数理分析,揭示数据中的潜在价值。随着各行各业中数据流的涌现及不确定数据管理技术的发展,传统的频繁模式挖掘算法不再能够满足应用需求。因此,面向不确定数据流的数据处理成为一个新的研究热点。本文对面向不确定数据流的频繁模式挖掘算法进行了研究,从对前缀树剪枝和改进预处理算法两个方面对SUF-growth算法进行了改进。本文的主要工作概括如下:1.概述了不确定数据流的产生原因及模型,分析了不确定数据流挖掘技术及框架,介绍了频繁模式挖掘相关算法。2.详细分析了SUF-growth算法中的倾斜窗口和前缀树结构,以基于时间衰减的历史数据压缩算法为基础给出了基于结点距离的前缀树剪枝算法。仿真实验表明剪枝算法能有效降低前缀树规模和算法计算量。3.详细分析了基于前缀树的频繁模式挖掘算法的预处理模块,结合前缀树剪枝算法给出了单遍扫描的频繁模式挖掘算法。仿真实验表明该算法从降低构建前缀树的时间代价的角度提高了SUF-growth算法的效率。
其他文献
随着计算机网络的迅速发展和商品经济的日益繁荣,电子商务在人们生活中起到了越来越重要的作用。电子商务教学系统是在理论教学的基础上增加了模拟电子商务流程中的各种交易
目的探讨高血压患者盐摄入量对其左心室质量指数与尿蛋白的临床影响。方法选取2018年1月至2019年1月于我院就诊的高血压患者96例作为研究对象,检测尿钠水平以评估盐摄入量,分
根据生物大分子子的生理特性,设计了三种不同的电化学电解池,分别用于研究独脾铁蛋白,细菌蛋白的电化学特性,以及电诱导棕以固氮菌表达新生理特性。
随着社会经济的发展,职业教育的发展和人才培养模式成为研究的重点,尤其是边疆民族地区的职业教育。发展边疆民族地区的职业教育,提高边疆民族地区从业者的素质,是解决边疆民
本文从债券市场的角度探讨了上市公司发放现金股利的动因。以2008~2017年发行公司债券的A股上市公司为样本,用股息率衡量公司的现金股利分配情况,用信用价差衡量公司债券的收
本文主要采用一般意义上的研究方法,主要有比较法、文献研究法、宏观-微观分析法。通过对两种版本地理教科书结构的比较,得出以下主要结论:(1)人教版和湘教版地理1的结构以地
对患有卡他性和脓性子宫内膜炎的病牛采用多种药物进行治疗,对治疗效果进行比较分析。结果表明:治疗卡他性子宫内膜炎时,乳宫安的治愈率为80%,金乳康的治愈率为93%,洁尔阴的
有这样一则寓言,一把坚实的大锁锁在门上,有人拿来一根铁杆,费了九牛二虎之力,还是无法将它撬开。而有人拿来钥匙,只轻轻一转,大锁就"啪"地一声打开了。如果说营销是矗立在企
情绪调节的工具性动机观点认为,人们在情绪调节过程中不是简单地偏向积极情绪,回避消极情绪;情绪调节时的情绪偏好受到目标的影响,人们偏好有利于目标达成的情绪,回避不利于目
小肠胶囊内镜自2001年上市以来,至今已得到广泛应用。除小肠胶囊内镜外,其他类型胶囊内镜亦得到了广泛发展,如食管胶囊内镜、结肠胶囊内镜、探测压力/pH的胶囊内镜及完成多种