基于约束的序列模式挖掘算法的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yyn_8305112002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的序列模式挖掘算法能有效地在大型数据库中挖掘出完整的序列模式集。然而,随着应用领域越来越细化,用户对挖掘出来的序列模式提出了更高的要求。因此,将用户的要求或兴趣转化成一种或多种约束,来限定挖掘的序列模式是序列模式挖掘领域内的一个研究重点。本文针对这些问题,将研究重点放在基于约束的序列模式挖掘算法的研究上,这些研究问题在超市中顾客购买模式、网站访问页面的序列模式、电信告警序列模式和DNA模式等中有重要的意义。本文首先提出了一种基于规则表达式约束的增量式序列模式挖掘算法。此算法用规则表达式来表示用户的要求,然后把规则表示式约束有机融合到增量挖掘过程中,采用三种优化策略优化挖掘过程,以减少所消耗的时间。在动态数据库中挖掘约束序列模式时,此算法的性能明显优于FASTUP算法。其次,提出了当算法参数发生变化时序列模式的增量式更新算法。该算法基于格频繁模式树的结构,将前次挖掘得到的候选序列模式及其支持度的信息和索引集映射表都保存在格频繁模式树中,以便下次挖掘时使用,缩小了模式搜索空间,降低了模式挖掘的时间。在最小支持度阈值逐渐变小时,该算法的性能明显优于MEMISP算法。最后,提出了一种基于时间粒度的周期约束序列模式挖掘算法。该算法采用日历中的时间概念作为周期约束中时间戳的表示方法,描述现实世界中的时间概念,通过构建HP-CSB,采用两种候选序列生成方式,提高了挖掘效率,其算法的性能优于PrefixSpan算法。实验结果表明,本文提出的三种算法的挖掘性能明显优于现有的同类算法,实现了预期的研究目标。
其他文献
目前,作为电子商务重要组成部分的物流信息系统成为近年来信息化研究的热点之一。由于开发技术与运行平台的差异,不同物流企业的物流信息系统往往是异构的,这使得它们之间的信息
目前,网络和信息安全已成为一个普遍关注的问题。网络的各种入侵行为严重影响了信息的完整性、可用性以及机密性,并危及人们的正常应用。就此,人们提出了入侵检测的概念,并且
从利用密钥托管技术保障保密通信的安全性出发,以实现网络保密通信中密钥的托管和恢复为目的,对密钥托管技术进行了学习研究,在密钥托管机制的设计上进行了一些总结和探索。总结
无线传感器节点能量有限且通常部署在环境特殊的广阔区域中,因此节能是设计无线传感器网络应用首要考虑的问题。MAC协议决定节点接入信道的方式,直接控制节点能耗最多的通信模
论文对虚拟海洋环境的仿真进行了探讨,主要完成了以下四个方面的工作:首先,从随机海浪构造模型出发,利用海浪谱对海浪进行仿真控制,并且从波面细化,颜色处理和光照控制三个方面提出
计算机网络的迅速发展为全球范围内实现高效的资源共享和信息交换提供了方便。同时,由于计算机网络的开放性和共享性,其安全性已成为人们日益关注的问题。在世界范围内,针对计算
随着Internet的发展,电子邮件得到了普及,它的广泛使用给人们的生活带来了极大方便。可是,一些人出于个人私利,利用电子邮件的便利滥发垃圾邮件,不仅消耗了大量的网络资源,还使大量
随着世界经济全球化的发展,电子数据交换已成为企业参与贸易竞争的重要手段,企业迫切需要在更大范围内实现资源共享与数据交换。由于企业的平台和数据模式各不相同,传统的数据交
Ad hoc网络因其开放的信道、分布式合作、动态拓扑、无中心授权等因素,使得其路由协议的安全性比传统网络复杂得多,攻击者不仅可以对网络中传输的信息构成威胁,通信节点的身份、
SAR (合成孔径雷达)是一种成像雷达,主要用于机载星载拍摄高清晰度图像。它将合成孔径技术、脉冲压缩技术和数字信息处理技术三者结合起来,使用较短的天线,获得方向和距离两个方