XML小枝模式查询方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lijiarose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库和网络技术的迅速发展,XML已经成为网络上信息表达和数据交换事实上的标准。随着XML数据的不断增长,尤其是大规模XML数据的出现,对这些XML数据的有效管理和查询成为学术界和工业界的研究热点。由于XML文档具有的半结构的特性,使得传统的对关系数据库的查询算法对其不适用,因此如何高效地查询XML数据成为新的研究课题。本文对整体小枝模式查询展开研究,在XML数据库中,小枝模式查询是XML查询处理的核心操作,Twig查询处理的效率高低在很大程度上决定了整个XML查询的处理效率。近几年来,研究者提出了许多处理XML小枝模式查询的算法,最新的研究成果是整体小枝(holistic twig)模式查询方法,它把可以用树结构表示的twig作为一个整体来处理,整体twig查询可以避免结构连接产生大量的中间结果而具有很大的优越性。现在提出的算法在处理只有祖先后代关系的Twig查询时效率很高,但是对于带有父子关系的查询,这些算法的查询效率并不高,特别是产生了很多无用的中间结果。本文在总结和分析了现有的整体Twig查询算法后,发现现有编码在支持XML整体小枝模式查询方面信息不足。在XML编码中引入XML模式信息,提出一种新的XML编码方法,XML扩展区间编码方案,通过XML文档中某元素的扩展区间编码可以得到该元素所有孩子元素的标签名称集合。基于这种编码方法本文提出了整体twig查询算法-TwigStackBE算法,该算法能处理带A-D关系和P-C关系的Twig查询,并且是CPU和I/O最优的。然后本文利用扩展区间编码之上的索引结构,减少了算法扫描数据元素列表元素个数,对TwigStackBE算法进行了改进。通过把TwigStackBE算法与经典整体twig查询算法TwigStack,TJFast算法进行实验对比,可以看出TwigStackBE算法具体更优越的性能。
其他文献
近年来,随着微机电技术、传感器技术和无线通信技术的进步,推动了低功耗多功能的传感器的快速发展,使其在微小体积内便能够集成信息采集、数据处理和无线通信等功能。无线传
随着计算机网络和数据库系统的迅速发展,企业竞争与兼并的加剧,Web信息集成和企业信息集成的需求越来越迫切。在信息集成过程中,由于背景环境的不同,数据源可能是关系数据库
随着社会信息化进程的不断发展,人们对信息的需求和依赖程度越来越高,如何从海量信息中快速有效的获取有用信息,已经成为人们研究的焦点。信息集成的研究可以帮助人们有效的
随着信息时代的来临,人们越来越依赖来自网络中的信息,同时对信息搜索技术的准确率的要求也越来越高。然而,由于网络中的信息量呈爆炸式增长,并且还包括各种虚假,不相关等的
分布式一致性是分布式理论中非常重要的部分。随着互联网快速发展,分布式系统被广泛应用,系统功能越来越强大,结构越来越复杂,很多时候需要使用到一致性协调服务系统保证系统
随着计算机技术、网络技术日趋成熟以及信息化的普及,各种智能化家电设备不断涌入百姓家庭,数字化家庭网络的概念越来越受到人们的关注。其目的是打破各个家庭设备“信息孤岛
语音情感识别是情感计算领域的重要研究课题,是实现智能化人机交互的前提之一。语音情感识别的研究目前还处于一个起步阶段,对于如何提高识别速度和识别率已成为情感计算领域
电子商务是网络经济的重要体现。它以现代化信息手段代替传统交易过程中纸介质信息载体的存储、传递、发布等环节,从而在线地实现商品交易、服务交易以及交易管理等活动。本
在基于内容的图像检索领域中,颜色特征是应用最为广泛的视觉特征,一方面因为颜色是人眼识别图像的主要感知特征,另一方面,相较于其它几个低层特征,颜色特征对于图像的几何变
Internet网络传输和处理能力的大幅提高使得基于网络的应用越来越多,如远程教学、视频会议、数据分发和网络游戏等网络多媒体应用。这些多媒体应用有着数据量大、时延要求高