基于数据为中心的XML文档Twig查询算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:a_yelang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的发展,越来越多的应用采用XML作为信息表示和数据交换的标准,这使得通过数据库技术对XML数据进行存储、查询等操作变得日益重要,同时也为数据库研究者提出了新的挑战。 XML数据库查询不仅查找数据,还查找数据之间的结构关系。因此对于一个具有分支关系的路径查询表达式,查询的结果不仅是得到数据元素,而且要使节点元素之间满足结构关系,包括祖先后代以及父子关系,同时对于Twig查询还包括分支节点判断。为了处理Twig查询,很多算法被提出来,而最近对Twig查询主要是Holistic算法,即把一个Twig查询作为一个整体考虑,而不是把其拆分为多个路径表达式。 本文针对现有Holistic结构连接算法忽略文档结构特征的缺点,对于以数据为中心的XML文档的特点进行了分析并分类。我们提出了针对嵌套文档的扩展区域编码策略和针对横向XML文档的压缩叶子流策略。根据不同的策略,我们提出了针对嵌套文档的Nest Stack算法和针对横向文档的CPJoin算法,这两种算法针对文档结构特征更好的实现了XML Twig查询。同时为了有效地减少了中间结构的存储,我们改进了传统的两阶段策略,使得在手机、PDA之类的移动设备上也可以处理Twig查询。最后,通过真实数据与合成数据上的实验结果来证明基于压缩叶子流上的CPJoin算法和基于扩展区域编码的Nest Stack算法提高了Twig查询的性能。
其他文献
图形用户界面(GUI)是软件的重要组成部分。在软件系统的交互中,GUI被广泛的使用,变得越来越复杂,由此引发的GUI测试问题也越来越具有挑战性。但是,GUI的测试目前依然是一个较
当发生自然灾害、战争时,基础设施遭到严重破环,需要快速、灵活地建立一张临时的通信网用于交互信息,即:自组织救护网。自组织救护网是一种Ad Hoc网络。然而,已有的,成熟的Ad Hoc网
随着经济的发展,车辆数量急剧增大,交通问题日益突出,这使得智能交通系统成为一个热点研究领域,受到日益广泛的关注。车辆识别是智能交通领域应用的重要研究课题之一,是智能
近年来随着国家大力支持,我国遥感卫星技术迅速发展,应用也越来越广泛[1]。例如:在GIS系统、自然灾害监测、地理测绘、数字地球、城市环境、军事解读等领域都有非常广泛的应用。
云计算服务提供商通常会在不同地区构建数据中心用以服务不同地区的用户,给用户提供更加优质的服务。现在的具有多个数据中心的云计算系统通常会让用户自己选择在何处的数据
随着计算机和网络技术的迅速发展,针对网络和计算机系统的攻击也屡见不鲜,网络安全问题变得日益严峻。众多安全机构研发了许多安全产品,但攻击者的技术水平也在不断提高,安全
长期以来,烟草专卖业务中的案件处理过程一直存在着问题:一方面,由于案件处理流程的不规范使得工作人员在处理案件的时候具有较大的随意性,这种执法的随意性不符合烟草专卖行业严
随着互联网技术的迅速发展,数据业务逐渐成为网络的主流,而传统的IP/ATM/SDH/DWDM的结构方式日益成为制约数据业务快速发展的障碍,迫切需要开发新技术来解决这一问题。IP直接由
随着计算机科学技术的发展,自动识别技术得到了广泛的应用。在众多自动识别技术中,条码技术已经成为当今主要的计算机自动识别技术之一。识别技术和编码理论是条码技术中两个非
本文旨在研究如何将数据挖掘技术与学生就业问题相结合,从大量数据中挖掘隐藏在中等职业教育学校学生现有数据中的有用信息。本文介绍了数据挖掘相关知识,选取了关联规则中的