面向XQuery语言的树模式提取方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:qzhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网在当今社会已经是我们生活的一部分,有效的数据交换是互联网发挥其能力的基础需求。为了应对互联网中数据的愈发明显的异构特性,国际万维网组织(World Wide Web Consortium,W3C)发布了标记语言(eXtensible Markup Language,XML)的标准。XML是一种以自描述性和半结构化为主要特点的跨平台数据交换语言。然而上述特性也为XML的查询与处理带来了挑战。XQuery是W3C推荐的XML查询语言。为了在XQuery查询实现中有效的针对XML的自描述性和半结构化特征,TAX首次引入了树模式的概念。针对XQuery中的结构连接,树模式依赖结构连接间的关联性抽取并组合成一个整体的树形查询模式。在执行查询时利用上述树形模式完成XML数据源的引入和过滤。这种以筛选下移为基本思想的优化操作有效地减少了在查询中间数据量。因为此类优化行为需要在维持查询效果的前提下彻底改变XQuery查询的求值顺序,所以完整的XQuery的树模式提取算法涉及到诸多细节。针对XQuery中存在的复杂的连接/数据重组需求,传统的方法通常通过对树模式的提取范围加以限定或多次调用树模式匹配的方法完成。本文所撰述的是一组面向完整XQuery语法的树模式提取算法,详细的策略充分分析和考虑了变量、多数据源、迭代语句等对于整体匹配的影响。本文的算法以极大限度合并相关联的结构连接至一个更大规模(过滤效果更强)的树模式为基本思想,进一步减少查询的中间数据。算法以无回溯为原则设计,编译开销较低。本文所述的算法面向了XQuery出现的各种特征语法并且各种算法相对独立因而便于借鉴,因此具有实用价值。根据本文中所述的算法,文章最后给出了实现框架和性能测试。系统实现和相应的测试结果说明了本文中所述算法的有效性和对于查询效能的改善。
其他文献
运行在Windows操作系统平台上的程序或者应用软件,其性能常常因为某些无法预料的瓶颈而受到干扰,导致程序的处理效率降低,性能上得不到充分的发挥。而Windows操作系统在其运行过
本文对面向轻量级应用的开源WebGIS内核的设计与实现进行了探讨。本研究结合WebGIS的应用特点,基于Java技术设计实现了一个面向轻量级应用的开源WebGIS内核——PKGML2。在PKGM
本文依托国家自然科学基金项目(项目号:40202030),着重从矿产资源预测结果数据的三维重构方面入手,利用计算机图形学的相关算法,借鉴医学、游戏软件制作等领域中已经成熟了的可视
随着互联网的发展和网民数量的增加,网上电子商务市场也在不断扩大。伴随着电子商务的发展,网上的产品评论也越来越多。商家和网民都希望能有高效而准确的工具来处理这些产品评
最近几年,移动设备正逐步地取代传统计算设备,在人们日常生活中扮演着愈加重要的角色。伴随着移动设备的快速增长,保证移动设备上应用的质量成为一个急需解决的问题。因此,针
本文主要关注的问题是如何正确理解网页内容的真实语义并按语义之间的联系度量网页间的相关度。针对这一问题,作者提出了一种新型的信息检索模型,该模型的理论和应用包括:1)构建
随着信息技术在金融、交通、军事、生态监测、网络监测等领域的深入应用,需要计算机处理的数据类型和数据量与日俱增。作为一种新的数据类型,数据流在近些年得到了计算机界的广
开放、动态、多变的Internet环境要求运行其上的软件不仅具有较高的服务质量,而且需要更强的适应性在运行时刻保持相应的质量属性目标。 最近几年,在软件体系结构层次对软件
本文对数据流管理系统Argus中并行处理的性能优化进行了研究。文章指出,集中式的数据流处理系统已经不能满足规模同益增长的流数据的处理要求了,因此人们提出了并行数据流系统
新世纪信息技术和软件产业的一个显著的特征是计算机在网络环境中工作,依靠底层的通信链路交换信息.这就自然产生了越来越多的网络优化问题.这些问题通常是大规模的,需要快速求
学位