支持数据更新的XML结构连接的编码方案研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:ccscbr66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML已成为互联网上数据存储和信息交换领域事实上的标准,人们已经开始习惯使用XML文档来存储、管理Internet上的海量信息资源,因而Web也正逐步转化为一个庞大的XML文档数据库。如何对XML文档进行有效的存储、查询,已经成为当前XML数据库领域研究的热点。为了有效支持XML查询,特别是结构查询,提出了许多针对XML文档的编码方案。但是实际应用中由于XML文档的频繁数据更新,多数方案都需要花费很大代价重新编码,严重影响了XML查询的效率。在对现有XML文档编码方案进行透彻剖析的基础上,我们设计了一种支持XML数据更新的前缀编码方案IDSU ( Improved Dewey-labeling Scheme for Update-supporting)。通过扩展Dewey编码,它将XML文档树中的每一个节点赋予一个二元组<IDSU_id, depth>,其中IDSU_id表示节点的编码,其初始形式与Dewey编码相同;Depth表示节点在文档树中所处的层数,用来加速结构连接操作。该编码方案不仅高效地支持结构查询,能够快速准确的判断XML文档结构树中任意两个节点之间的父子、祖先/子孙以及兄弟关系,并且针对XML文档树频繁更新后重新编码的情况,设计了一种“编码相加”的更新规则,避免了更新操作带来的编码调整问题,可以更有效地支持XML文档数据更新。为验证IDSU编码方案的有效性,我们做了一些对比性实验。将IDSU编码方案和其他编码方案,在编码的时间、空间、查询、更新性能方面进行了全面、细致的比较分析。实验结果表明,IDSU编码在应对XML数据更新方面具备良好的优势,能有效的支持数据更新,完全避免重新编码,另外在结构查询方面,也有上佳的表现。本文的IDSU编码方案是在解决XML编码方案应对数据更新问题的有效尝试,对今后进一步的研究和实际应用都具有重要的参照意义。
其他文献
二十一世纪,网上购物已经成为人们主要的购物方式。随着互联网用户井喷式的增长趋势,电子商务网站每天不得不面临巨大的访问量。面对海量数据存储以及高并发读写,关系型数据
物联网是未来网络发展的方向,它的核心就是现在的互联网。无线传感器网络是一种低功耗低速率的短距离无线网络通信技术,也是物联网的重要组成部分之一,因此解决无线传感器网络与
随着国内金融市场的不断发展和完善,信用卡业务的增长为银行带来大量利润,信用卡客户的分析和研究也受到更多的重视。目前我国对客户价值的评价系统还比较简单,方法还比较单一,如
近年来,随着互联网+时代的来临,以及智能手机的普及,移动互联网越来越参与并辅助人们的生活。同时社会正面临严重的人口老龄化问题,日益增多的空巢老人数量,带来一系列的社会
随着经济发展,信息不对称、大量信息孤岛存在、客户数据无法统一等问题,增加了高科技企业信息管理工作的动态性和复杂性。本文从当前搜索引擎发展的背景和趋势出发,利用Microsof
传统的双语词汇词典,一般由人工整理、编辑,具有权威度高、词条质量高的特点,但是其编制需要花费大量的人力、物力和时间。与此同时,随着互联网的发展和社会的发展,各种各样
由通用机器组成的大规模集群作为并行计算的有效途径之一,广泛应用于科学及工程中的计算模拟、海量数据处理等复杂问题中。并行编程模型是并行计算及开发并行软件的基础,是决定
随着移动互联网的快速发展,随时随地进行网络在线阅读已经成为现实。特别是以起点中文为首的在线读物网站为阅读爱好者提供了数以百万计的网络原创文学读物,丰富了文学爱好者的
上世纪90年代以来,随着互联网的发展,电子商务在社会经济领域发展迅速,电子商务推动了商业、贸易、营销、金融、广告运输、教育等社会经济领域的创新,给企业带来许多新的机会。现
随着网络资源的爆炸式增长,“信息过载”,“信息迷向”等问题的出现,用户如何快速有效地获取信息,成为现今信息服务系统亟待解决的问题。传统的信息服务也逐渐向个性化信息服