无重叠条件下的Top-k序列模式挖掘

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:ru438185839
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在序列模式挖掘研究中,带间隙约束的序列模式挖掘因其高效性和有效避免盲目挖掘冗余模式而成为当下的研究热点。无重叠条件序列模式挖掘是一种带间隙约束的序列模式挖掘方法,能够有效地克服当前此类挖掘中的问题。无重叠条件是指在一次挖掘过程中,序列中相同位置的字符不能在模式的相同位置处重复使用。但是当前的方法仅仅用于挖掘频繁模式,且最小支持度阈值不好设定。为了高效地挖掘最为频繁的k种无重叠序列模式,本文在无需预先设定支持度阈值情况下,挖掘无重叠条件下Top-k序列模式。本论文的主要研究内容与相关工作如下:(1)首先,分析了Top-k序列模式挖掘产生的原因与背景;介绍了三种挖掘条件并进行了比较。对带间隙约束的Top-k序列模式挖掘算法NOSEPK和Top-k序列模式挖掘算法ENUMK进行了描述和分析,指出他们所存在的不足,因而提出本文算法TOPMINING。(2)本文算法TOPMINING采用网树结构计算模式支持度,无需设置最小支持度阈值,有效解决了最小支持度阈值ρ在频繁模式挖掘中难以设置的问题;采用高效的模式增长策略和精心构建的数据结构——模式增长树,快速且完备地找出所有模式中支持度最高的前k个模式。(3)而后,针对短模式过多的信息量不足问题。提出了算法TOPBYLEN。通过给出候选因子e,通过支持度较高的前k*e个模式进行增长,减少了模式候选集的数量,而且对模式进行了有效压缩。(4)本文针对无重叠条件的Top-k模式挖掘问题,分别研究了传统Top-k模式挖掘和特定长度的Top-k模式挖掘,并给出了相关算法。最后通过对比实验,验证了两算法的可行性与有效性。
其他文献
大规模MIMO(Multiple Input and Multiple Output)技术作为第五代移动通信(5G)的关键技术之一。相比于传统的MIMO系统,大规模MIMO系统的空间分辨率和功率效率显著提高。然而,
随着我国经济、技术的迅速发展和城市化进程的逐渐加快,在役的钢结构不断地出现损伤和破坏。因此,对无法正常使用的钢结构进行加固势在必行。此外,钢结构损伤有多发性和不确定性
本研究以响叶杨组培苗离体茎尖为受体材料,利用秋水仙碱浸渍法、共培法分别处理材料,对比分析秋水仙碱不同浓度、不同时间的诱导效果。对处理材料的叶片、茎粗、株高、生根情
建安文学在中国文学史上占有重要的地位,历来受到较多文人学者的关注。有明一代,学者评家对建安文学的关注度明显提高,对其的批评进入繁荣期,并持续保持稳定。此时的批评内容
黑磷是一种新型的范德华层状半导体材料。近年来,因其平面内的强烈的电学、光学各向异性以及其层数依赖的电子结构特性引起了研究者的广泛关注。对黑磷材料进行掺杂来改变其电学、光学特征也成为研究热点之一。基于此,在原子尺度了解黑磷中缺陷对黑磷本征电子结构的影响就非常重要。本论文的主要研究内容为利用扫描隧道显微镜/扫描隧穿谱(STM/STS)、密度泛理论(DFT)计算和模型模拟三者的结合,来研究黑磷表面上单个
文化是一个国家、一个民族的灵魂,儒家道德教化思想在中国古代思想史中长期占据重要的主导地位,其传承至今仍具有强大的生命力与创造力。在儒家道德教化思想传承多年的历史背景下,《礼记》作为儒学经典著作之一,其包含的道德教化思想,层次之丰富、内容之深刻,给予后世的影响之深远,在中国儒学思想史的发展中是不可替代的。《礼记》一书作为儒家道德教化思想的资料汇编,目前学界普遍认为其为西汉礼学家戴圣所撰,全书共二十卷
2013年开始,国家发改委连续取消下放行政审批事项,行政审批事项目录清单由长变短,改革的进展明显。由于坚持推进简政放权,大幅度地减少行政审批事项,减少投资障碍,大幅减少政府定价范围等一系列举措,极大地促进了我国国民经济稳步发展。我国当前正处在深化行政体制改革,政府职能变更的战略关键时期。本文主要探讨在这样的大背景下,政府的权究竟“简”在了哪里,又“放”在了何处,从而引出了帮助沟通和调节政府,市场,
在生产、流通以及消费等环节以减量化、再利用、资源化为基础发展的经济模式被称为循环经济,是一种“资源-产品-再生资源”经济增长模式。进行经济结构调控,促使循环经济更好
地震作为一种破坏性极强的自然灾害,具有极大的不确定性和随机性。地震情况下核电站风险评估方法有两种:地震概率安全评估方法(SPSA)和抗震裕量评估方法(SMA)。本文以AP1000核电站为研究对象,详细地介绍了 SPSA方法。地震易损性分析作为SPSA的重要步骤,本文详细地介绍了构筑物及设备的地震易损性分析计算方法及其涉及到的变量,并据此对堆芯补水箱(CMT)进行易损性分析,获得其易损性曲线,同时计
随着遥感技术的逐渐成熟,成像光谱图像在目前社会中的应用越来越广泛。但是由于成像光谱仪的限制,大多数成像光谱图像的空间分辨率较低,这也就导致了混合像元在遥感影像中大