基于lazyDFA的XML数据流查询处理及优化技术研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:lianghaiyanps3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融证券管理、Internet流量监控、Web使用日志等新型应用领域对数据的管理与分析提出了新的要求,数据流及其相关技术已经成为当前数据处理领域的研究热点之一。由于XML语言已经成为互联网上信息表示和数据交换的重要标准,所以也就相应地出现了大量的XML数据流相关应用,比如基于内容的XML路由、Web服务、主动服务中的订阅和发布系统等。在这些应用系统中,XML数据是以流的形式不断地快速到达的。因此对XML数据流进行管理和分析的理论和技术又成为目前数据流研究领域中的一个热点。XML数据流处理系统都是运行在Internet环境中的,该环境下的用户是海量的,海量的用户利用XPath查询语句描述其需求,那么如何在XML数据流上执行海量的XPath查询便成为XML数据流应用中一个迫切需要解决的问题,因此本文选择该部分进行研究。本文结合XMI数据流处理中每个XML结点最多只能访问一次、处理算法具有尽可能小的空间复杂度、每个结点的处理必须具有很高的时间效率以满足实时处理需要的特点;分析和研究了目前解决XML数据流上查询处理的方法和实现机制;根据XPath语法规则,即任意一个XPath路径表达式都可转化成一个正则表达式,基于自动机理论,完成了NFA和lazyDFA的构造,实现了XPath表达式的查询处理,并为提高自动机的查询效率提出了前缀路径共享、共享NFA状态表、建立状态转移表、基于DTD语义信息和基于DTD结构信息的五种优化算法。最后对本文构造的自动机及其优化算法进行了性能测试,实验结果表明自动机技术可以有效地处理XML数据流上的海量XPath查询表达式,而且优化算法也可以有效地提高自动机的查询效率。
其他文献
在诸如核能发电、电力调度、航空航天等高成本高危险行业,对于控制系统可靠度要求极高。对于这类行业,如何提高控制系统的可靠度是一个极其重要的问题。随着集成电路技术的快
船舶动力定位系统表示动力定位船舶需要装备的全部设备,包括动力系统、控制系统、推进系统三个主要部分,其中,控制系统是整套动力定位系统的核心部分。本论文针对船舶动力定
纸浆洗涤过程是制浆造纸生产中非常重要的一环,其洗涤效果直接影响到后续工段的顺利进行。而洗浆过程属于大时滞、非线性、变参数系统,由于无法建立起精确数学模型,从而使得传统
集成起动/发电机(ISG)是用一个电机代替发动机上起动机和发电机,具有起动和发电两种基本功能。ISG技术的应用能够降低内燃机排放,节约燃油,具有重要的经济意义和环保意义。本
激光切割是热切割技术发展的热点之一,作为一种新兴的热切割方式,它具有高效率、高精度、低噪音、污染小等特点。高度调节系统是激光切割机的一个极其重要的组成部分,它直接
目前大多数水印算法采用线性相关的方法检测水印,但是,当原始媒体信号不服从高斯分布,或者水印不是以加性嵌入方式嵌入到待保护的媒体对象中时,该方法存在一定的问题。数字水
在大型水利水电建设项目中,物资供应是保障工期进度和质量安全的必要条件,二滩水电开发有限责任公司在雅砻江流域的梯级水电开发项目中,面临着多项目同时开工、物资需求量大
图像分割是数字图像处理的基本组成部分,也是接下来对图像进行分析、处理的基础,图像分割的效率和准确性对后续工作来说至关重要。阈值法中Otsu法因为其简单可行而且性能稳定
本论文主要研究内容包括以下三个方面: 1)讨论故障诊断的基本原理(包括故障的定义、故障诊断的主要任务等),过程监控的量度以及各种故障诊断的方法;并重点介绍专家系统和故障
本文以采用集中监控、分散控制多电机方案的国防某实验基地弹目空间交会模拟平台控制系统为基础,运用嵌入式系统方案设计了其主控制器,并通过设计的ZigBee无线协调器加入无线