基于区间编码的XML索引研究及优化

来源 :南开大学 | 被引量 : 0次 | 上传用户:keaiyuyu66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML作为网络数据交换和信息集成的工具,以其自描述性、跨平台交换性等特点,成为新一代的网络语言。互联网上越来越多的结构化或半结构化的数据采用XML格式存储和交换,随着XML数据量的不断增长,要求更有效的数据管理能力和更快、更精确的查询。因此,对XML数据的索引及其结构查询的研究显得日益重要。   为了有效的支持XML查询,特别是结构查询,目前已有很多文献提出了XML数据的各种编码方案。这些编码方案更多地是将关注点放在如何设计编码结构以改进索引空间,以及在进行结构查询时所花费的时间代价较小,而对于支持XML文档数据的更新问题则很少进行深入的探讨。如何既能改进XML索引的结构查询效率,又能降低文档更新的维护代价,这是本文研究的主要内容。   本文基于区间编码的索引编码方案,提出了一种改进的优化方案,将从索引结构、结构连接查询和文档更新维护三个方面对该方案进行研究。   本文的主要研究工作如下:   (1)改进区间预留算法。针对该算法中人为预留区间存在一定的缺陷与不足,采用按照节点密度进行区间分配,从而对索引空间进行有效合理地分配,提高其空间利用率。   (2)在结构连接查询中,对参与连接的节点集进行先序排序,使其满足块间有序;在Stack-Tree算法的基础上利用分块有序的节点编码信息跳过那些无需参与连接的祖先或后代节点,从而快速完成结构连接。   (3)对于XML文档更新算法引入假设检验方法进行决策分析。在数据更新时,通过判断当前的区间划分是否在可接受的范围内,来降低将来文档在更新时需要重新划分区间的机率,从而达到对区间的有效划分和利用,降低对XML文档的维护代价。   最后,本文开发了原型系统对提出的索引方案进行了一系列实验。实验结果表明基于区间编码的索引优化方案具有较好的性能。
其他文献
作为现代控制领域的一个重要分支,混沌系统的控制和同步技术近年来受到了国内外的控制界的广泛重视。本文就此领域的相关问题展开系列研究,主要研究了混沌系统的控制和反控制
伴随着Internet的飞速发展,Web技术在各行各业得到了广泛应用,并发挥着越来越大的作用,同时也加快了国家的信息化进程。特别是Web2.0时代的到来,越来越多的政府机构、公司企业和
随着信息检索技术的不断发展,信息检索模型不同阶段出现的风险问题,如相关性估计中的风险,文档排序中的风险,查询扩展中的风险逐渐地被关注。研究这些风险问题的突破点是设计一种
随着经济全球化的发展,尤其是计算机技术的发展,越来越多的中小企业进入国际市场,参与全球竞争。面对新的市场竞争环境,原有的管理模式难以适应新的变化。为了有效利用各种生产资
在大规模的无线传感器网络中,节点的密集部署使得节点间数据传输冲突增加,降低了节点间通信效率,影响了网络的吞吐量和连通性,浪费了有限的节点能量。因此设计高效优化的无线
图像是人类获取外界信息的主要来源,随着计算机技术的飞速发展,人们对图像的质量提出了更高的要求。由于传感器昂贵的成本和其成像单元的物理限制,图像超分辨率技术应运而生
近年来,由于自然灾害的发生导致通信设备瘫痪、通信链路中断,对救灾工作造成了严重障碍;而偏远地区存在的通信盲区对于监控管理也带来了极大的不便。构建无盲区可靠应急通信
随着网络分布式系统的广泛发展,中间件技术显得越来越重要。其中技术最成熟的是对象管理组织OMG制定的CORBA(Common Object Request BrokerArchitecture,公共对象请求代理体
虚拟植物是指在计算机上应用虚拟现实技术在三维空间中模拟植物的生长发育过程。虚拟植物可视化技术的研究是虚拟农业研究的重要组成部分,在数字农业、大型自然场景仿真系统
教学管理工作是高等学校教育工作的一项重要内容,是整个学校管理的核心和基础。教学管理工作是指学校管理人员按照一定的教育方针,运用先进的管理手段,组织、协调、指挥与指