原生XML数据库动态结点编码方案分析与应用的研究

来源 :天津工业大学 | 被引量 : 3次 | 上传用户:grandbill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML相关标准的制定,Internet上出现了大量的XML文档,如何有效地管理和查询这些文档成为一个亟待解决的问题,这一问题的出现极大地促进了XML数据库技术的研究。原生XML数据库(NXD)是专为存储和管理XML文档而提出的,在NXD中的XML文档查询主要包括值查询和结构查询,其中的结构查询是XML查询的一个重要内容。判断结点之间的结构关系的主要思想是将一个复杂的查询模式分解成为若干个二元基本结构关系的集合,首先计算二元基本结构关系,然后将基本的匹配结果组合起来。在这种处理策略下,基本结构关系(包括父子关系和祖先-后代关系)的计算成为查询处理的关键操作,这种操作被称为结构连接(或包含连接)。各种索引的建立可以提高结构连接算法的效率,而XML结点编码可以方便地建立各种索引,所以XML文档结点编码方案的研究引人注目。本文在对原生XML数据库中动态结点编码方案及其应用进行透彻剖析的基础上,重点对三种动态结点编码方案,即ORDPATH编码、DeweyIDs编码及DLN编码进行了研究,并用C#开发了三种编码方案的软件。然后,用十个标准的XML文档测试集对三种编码方案进行测试,根据测试结果对三种动态编码的确定性、动态性和压缩性进行了分析与比较:在此基础上,从理论上进一步对XML动态编码的性能进行了分析比较,着重分析了动态编码的压缩性。对动态编码压缩性理论分析所采用的标准是:编码K个层标识占用的存储空间S,分别对用固定长度、长度域、前缀编码及控制标记等四种方式编码K个层标识占用的存储空间S进行统计,最终归纳出关于S与K的通式。通过一系列研究,进一步验证了动态结点编码在编码时间和空间效率的高效性。最后,对动态编码方案在查询计划和查询处理模型中的应用进行了探讨。
其他文献
论文论述了系统开发的背景,从应用需求和技术需求两个方面阐明了系统的目标和任务,提出了基于网络服务的安全阅卷系统的方案,并详细论述了该方案的设计与实现过程。最后对本
将多个处理器核集成到一块芯片上以提高系统芯片的整体性能已经成为下一代SoC (System On Chip)设计的发展趋势,而各处理器核之间通信效率的提高又成为多处理器芯片设计的关
无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作地完成实时监测、传感和采集目标对象的信息,并对其进行处理,传送给需要信息的用
互联网技术的迅速发展导致了信息过载问题。面对信息过载问题,虽然有相关应用如检索系统和搜索引擎可以帮助人们更精确的找到所需要的信息。在某些应用领域,比如电影、音乐、
计算机网络已经逐渐成为单位,个人工作以及生活中不可缺少的一部分。由于计算机网络的应用越来越广,使得计算机网络规模更加的庞大、结构更加复杂、支持的用户更多,人们逐渐
学位
脑-机接口(Brain Computer Interface,BCI)技术是不依赖于常规脑外周神经和肌肉系统,连接人脑与外界(计算机或其它外部设备)进行信息交流和控制的全新通道。脑-机接口将人脑
本体做为语义网络中表示Web信息语义的一层,用于描述某个领域内的概念以及它们之间的联系,是解决语义层次Web信息共享和交换的基础。这些不尽相同的本体尽管是对同一领域进行
裁剪是计算机图形学中的一个重要技术。裁剪有多种类型,其中,二维多边形裁剪是目前裁剪研究的主要课题。矩形(或多边形)对多边形裁剪已有许多经典的算法。由于没有完全避免求
合成孔径雷达(Synthetic Apeture Radar,SAR)是一种微波成像系统,在军事、经济和社会等领域具有广泛应用,因此,对SAR图像的解释引起了广大学者的高度重视,而SAR图像的分割是