一种针对正规树模式的复杂事件查询方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wjlwny110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,越来越多的领域以流式数据进行信息传输,如股票市场和社交媒体等实时系统的数据就是实时到来的,并且对流式数据进行查询的需求也在日益增加,所以如何在流式数据上高效地进行复杂的查询即是目前面临的问题。很多领域经常把事件响应机制作为信息处理的计算模型,流式数据就可以抽象为一种复杂的事件流,因此,在这种事件流上进行混有结构约束和时序约束的查询就是一种复杂事件查询,也就是从数据流中查找符合特定数据模式的数据。鉴于对流式数据的需求日益增加,更加强大的事件描述能力和更加高效的事件查询效率就成为了处理流式数据的一个重要的研究方向。XML是目前主要用于交换和存储半结构化数据的标准描述语言。Twig模式匹配查询方法是XML数据查询的核心,它能够描述XML查询中的结构约束关系并通过整体匹配方法达到高效的处理查询。但Twig模式无法描述复杂事件查询中的事件间时序关系。为了提高查询模式的描述能力,具有更加丰富语义的算子被引入到查询请求中,诸如使用克林闭包、连接等运算符以及引入更加丰富的轴关系等。而正规式可以用来描述查询中含有的时序约束关系,所以可以将正规式加入到Twig模式中形成正规树模式,用来描述复杂事件。目前复杂事件查询的方法主要集中在针对仅有结构约束的查询请求,对同时含有时序约束的查询请求并不能很好地支持。因此,针对XML这种半结构化流式数据,本文提出了一种基于下推自动机扩展的模式匹配算法。该方法针对XML格式事件流,利用正规树模式来描述复杂事件,通过整体性匹配的方法,高效率的进行复杂事件查询处理。通过对比实验也证明了该方法比已有的复杂事件处理方法具有更高的性能。
其他文献
本文主要针对平面上相邻可能相交凸多边形序列的遍历问题进行研究,目标是寻找一条从起点s出发,按照它们事先约定好的顺序依次遍历每个凸多边形,最终到达终点t的最短路径。该
同一时期的壁画装饰图案拥有艺术创作的共性,这些共性表现在图案的总体布局以及单位元素的构图规则上,根据这些信息我们可以对大量年代信息不明确的图案进行分类。本文主要针
自组织链表是一种实用的数据结构,可以根据访问序列动态调整列表结构,适应访问模式,目的是减少平均访问时间并提高链表的性能。如果被访问的数据局部性较强,自组织链表能够比
随着互联网以及多媒体技术的飞速发展,使得数字视频在人们的日常生活中越来越普及。人们可以方便的使用手机等便携设备拍摄数字视频,在线视频播放网站如雨后春笋般涌现,大型
信息时代社交网络飞速发展,逐渐成为了人们生活不可或缺的一部分,加上全球定位系统(GPS)的广泛应用和用户对于兴趣点(point of interest)分享的需求,基于位置的社交网络(Loca
本文借助贸易引力模型和多元线性回归模型探究中国与“一带一路”的双边贸易和经贸关系现状,在最基本的贸易引力模型上扩展,加入建交时间、人口密度、距离等变量,以“一带一
自动问答系统的研究目标是正确地理解用户以自然语言描述的问题,进而高效、准确地反馈给用户答案。问句分类是问答系统的第一步,准确地对问句分类不仅能够有效地缩小答案搜索
2013年9月,《关于政府向社会力量购买公共服务的指导意见》提出,“到2020年要在全国建立较完善的政府购买公共服务体系”。党的十八届三中全会提出“政府的相关事务性服务可
随着广播技术的提高,数字化,网络化进程的推进,广大用户对广播和电视节目接收效果的要求也越来越高,这给广大工作在一线的无线工作者们增加了更多的工作量与工作任务。DF500A
可扩展标记语言(eXtensible Markup Language,XML)是W3C提出的一种半结构化的数据描述语言,由于具有高可读性、可扩展性、自描述性以及跨平台等特性,在互联网上得到了广泛的