基于宏森林自动机的XML流数据查询技术

来源 :北京工业大学 | 被引量 : 5次 | 上传用户:cmccetehi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可扩展标记语言XML是一种半结构化的数据描述语言,因其具备高可读性、跨平台性和可扩展等特性,在互联网领域被广泛应用。XML不仅是一种优秀的数据存储格式,而且还是互联网中数据共享和交互的一种标准。针对XML数据的查询匹配算法一直是数据库领域的研究热点。近年来,网络在各行业和人们日常生活中快速普及,网络中应用的数量急速增长。很多基于网络的应用系统会持续地自动产生大量细节数据,例如气象实时分析、金融交易日志、互联网安全监控等系统。随着网络中数据交换量的激增,“XML流数据”受到了研究者们普遍关注。从流数据一次存取、持续处理、有限存储和快速响应等处理要求可知,人们从持续到达的海量数据中识别出有价值的少量数据,不仅需要丰富的查询功能和强大的查询处理能力,而且应该避免占用过多系统资源,但现有的大部分面向传统XML数据库的查询机制,并不适用于XML流数据,这给XML查询处理提出了新的需求和挑战。因此,研究针对XML流数据的查询处理算法就变得尤为重要。基于宏森林自动机的XML流数据查询算法被认为是最优秀的XML流数据查询算法之一,本文提出一种根据XPath查询构造宏森林自动机的方法,该方法支持范围覆盖了XPath查询的核心部分,如PC轴、AD轴、任意多重谓词和任意层次的嵌套谓词。通过实验证明,本文提出的方法扩展了查询的支持范围,同时根据该方法构造的自动机状态数目和查询的复杂度线性相关,不仅可以正确地查询出目标结果,而且算法具有很高的执行效率。
其他文献
人体动作识别是计算机视觉领域中非常重要的研究任务之一。随着高科技信息化时代的到来,越来越广泛的实际应用对该技术提出了更高的要求。首先,现有的动作识别方法多针对于视角
数字水印和信息隐藏是近年来发展起来的一门新兴学科,各种传统的技术领域比如图像处理、多媒体技术、密码学和信息安全、通讯技术乃至基础数学等等,在这里找到了交汇点。随着科
现如今,越来越多的探索和遥感卫星被发射升空,这些航天器大多搭载了遥感成像设备,而且成像设备的精度也大大增加,由此产生的大量图像数据以及有限的数传带宽对星载图像压缩设备的能力提出了更高的要求。本文研究了CCSDS图像压缩标准,一种专门为星上图像压缩解压而设计的图像压缩标准,并提出了增强其并行处理能力的改进方法。图像压缩算法主要有2个阶段:小波变化和位平面编码。本文的主要工作为:(1)详细分析了CCS
在网络中,人们主要使用密码技术来保护数据的保密性、真实性和完整性,并在此基础上形成了数字签名技术、身份认证技术以及机密共享技术等数据安全的保障措施,所以说,密码技术是信
理解和发现数据内在的生成规律一直是科学家研究的重点。近年来,随着深度学习以及表示学习理论的发展,数据中的生成因素解析逐渐成为机器学习研究的热点方向之一。理解数据中的
分布式对象技术是将面向对象技术与分布式技术相结合的一种分布式计算技术,该技术利用了面向对象的封装性,将一些小的相关的对象组合在一起,形成一个相对大的组件,为用户提供一系
图像处理是计算机视觉和模式识别的主要方向之一,图像处理一般分为图像理解、图像分析、狭义的图像处理三个层次.而聚类是数据挖掘的重要方法,已经在图像处理的各个层次有很
过去十年中,基于图像的绘制技术成为了计算机图形学和视觉的交叉研究领域。这种技术可以保存精细的细节和复杂的光照场景。但是,由于摄影器材的缺陷,在图像采集过程中,会不可避免
动态几何是20世纪80年代诞生的,自从诞生以来,它迅速发展,在教育软件、CAD/CAM、计算机游戏软件的设计与开发诸多方面都有广泛的应用。在教育软件方面,它带来了教学内容、教学方
本文的工作是将贝叶斯网扩充为带区间参数的贝叶斯网,具体工作分为以下几部分: (1)将区间概率引入概率表,使得贝叶斯网对模糊事件和值不确定事件的处理能力更强,扩展了普通贝