Knowledge Discovery using sequential pattern mining

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:tuojing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Mining of sequential pattern algorithms is the most important in data mining field and is the key of many knowledge discovery applications.However,running such applications need memory and time,particularly when dealing with vast amounts databases.Choosing the unsuitable support threshold is the main factors to consume additional memory as well as time.On the other hand,it may present huge numerous of frequent patterns and that is hard to obtain the useful patterns,and it is not easy to compare the results.The problem itself will be increased and be more complicated,especially if the sequences are long such as stream sequences.
  To solve this problem,we redefine the problem of mining sequence patterns as the problem of mining the Top-K Sequential Patterns,where K is the number of sequential patterns to be set by the user.The current best algorithms for this problem are TSP,TKS.This study introduces the research on the conception of developing an effective pattern sequential model to overcome the aforementioned problem by organizing discovered patterns.There are three aims of this study:1)To reduce melnory consumption:a dynamic technic is proposed,where the minimum support is set dynamically instead of static;and,the algorithln is based on pseudo-projection and BI-Directional Extension collectively;2)To reduce time consumption:we supported the algorithm with three space pruning functions in order to update the minimum support upon the discovered patterns.Finally,a more efficient algorithm than standard algorithms is proposed;3)improve the accuracy of multilinear regression energy system model through cleaning training sets using the proposed efficient algorithm.
  The extensive study and experiments were done on various real datasets with different sizes,which demonstrates that the proposed algorithm is more efficient compared with the other related algorithms.
其他文献
通过对中国古典舞身韵气息的研究,从理论层面到实践层面掌握身体之气的运行与循行路线,以把握中国古典舞的风格特征。本论文以气息为切入点,探讨中国古典舞中气息的来源及其概念,解决舞者在舞蹈中的气息运用问题,从而体现中国传统文化的精神核心。  体现中国古典舞的气韵,就是气息在体内循回流走,气息贯通,带动肢体运动,在“拧、倾、圆、曲”中体现中国古典舞的“形、神、劲、律”,从而产生“气韵”。气息是中国古典舞身
学位
博物馆是人类社会发展到一定阶段的历史性产物。它经历了漫长的发展过程。  博物馆的重要性逐渐被大众肯定。而历史类博物馆在中国仍处于主导地位。所以,对博物馆陈列设计的研究也是一项极其艰巨的任务。笔者参与了一项历史类博物馆陈列设计的工作,在此过程中经研究发现了一些问题。而这些问题的原因大多是前期工作做得不够细致,而导致后期返工。所以,一个良好的前期准备工作对于博物馆陈列设计工作是非常重要的。对于观众来说
本文以莫迪洛插画中一系列的艺术形象与艺术形式为切入口,以莫迪洛对漫画的诠释意义为契机,具体探讨了其画作在感官层面所展示的人物造型、色彩构图及以此所营造出的超现实浪漫氛围,深层挖掘在莫迪洛画作背后所具有的普遍价值,黑色幽默的寓意以及莫迪洛的画作对生活本身的超越意义。进一步探索莫迪洛创作的思维脉络,以此来感受莫迪洛画作振奋人心的精神力量,完成对莫迪洛绘画的深层解读。
学位
稠油资源分布广泛,储量丰富。随着人类社会对石油需求量的不断增加以及未来将面对的各种能源短缺等实际问题,稠油资源的开发和利用也变得越来越重要。为了降低稠油开发成本、提高稠油开发经济效益,提出了稠油出砂冷采和适度出砂技术。油井的适度出砂能提高产能,增产效果在稠油油藏中非常显著,国内、外有很多成功例子。出砂的同时油层将发生一定程度的压实作用,使孔隙压力升高,驱动能量增加,释放了油层的产能;同时出砂形成蚯
中国加入WTO以后,由于出口环境的改善,机电产品的出口数量大幅上升,石油机械产品的出口也从无到有,数量也在逐年不断地增加,近年来,抽油机的出口也成逐年上升的趋势。抽油机是油田有杆抽油系统的地面驱动设备,其数量占油田采油设备总数的90%以上,其中游梁式抽油机应用最广。  随着油田的不断开发,地层压力逐渐降低,开发的油藏类型越来越复杂,投入开采的储层深度不断增加,一般抽油机难以满足开采要求,急需大功率
学位
很多工业生产过程(尤其是石油工业中)存在大量需要将多相混合物分离开来的工艺操作。在炼油厂、化工厂、电站以及其他一些工业生产设施中,各油水混合物的分离都会产生较多的问题。由于尚未完全掌握油水混合物的特性、流动特点以及如何较好地利用其属性以达到所要求的分离效果,故将油从水中去除或者分离面临很多的挑战。由于运营和经济方面的压力,近年来石油工业致力于发展取代传统油水分离器的创新型代替品,其中T型管和水力旋
学位
上转换发光材料被广泛应用于激光、立体三维显示、波导、调温、成像、防伪、温度传感器等众多领域。提高上转换发光效率是上转换发光材料得以进一步应用的关键。三价稀土离子Er3+是实现红外到可见上转换荧光和激光材料首选的激活剂,充分研究Er3+离子的上转换发光特性对推进上转换应用有重要意义。为了进一步提高Er3+离子的上转换发光效率,本文系统地研究了基质材料、掺杂敏化剂、烧结温度和冷却速度对Er3+离子上转
CDMA技术已经成为第三代移动通信系统中的主流技术,它与传统的FDMA、TDMA不同,在CDMA系统中多个用户均占用同一时隙、同一频隙,所不同的是选取的地址码不同,而实际选用的地址码间的互相关函数又不可能全部达到理想状态的全为零,因而造成了多个用户同时通信时,必然要产生多址干扰。而多用户检测则是充分利用所有用户的信息来对接收信号做联合检测,抑制多址干扰,从而提高系统的容量。本论文在对扩频通信理论基
学位
自从1988年发明双包层光纤以来,光纤激光器成为国际光电子行业的热门研究课题,它以优越的性能和广泛的应用前景而成为第三代激光技术的代表。本文从理论和实验两方面对掺Yb3+双包层光纤激光器进行了深入研究,主要包括以下内容:(1)概述了光纤激光器国内外的研究进展和主要应用,指出了本课题研究的现实意义。(2)介绍了掺Yb3+光纤激光器的基本理论:描述了Yb3+离子的能级结构和光谱特性;分析了实验研究中常
JVT/H.264是ITU-T VCEG组织和ISO/IEC MPEG组织共同研究的新型视频压缩标准,是目前图像通信研究领域的热点问题之一.作为多媒体通信网络的重要组成部分,H.264不再把编码和网络区别的对待,H.264综合考虑了编码效率和网络传输,特别适合流媒体的传输, 因此它的研究和实现具有相当重要的意义.该文的研究工作正是在充分理解这个编码方案的背景、难点和重点的基础上展开的,研究了方案中
学位