支持数据更新的XML压缩编码研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:eva37
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,可扩展标记语言XML得到了极大的进步,已经成为Web上信息交换与数据处理的标准。由于XML数据具有描述能力强、结构信息丰富、语义明确、可扩展性好等特点,已经被广泛应用于各个领域。但由于XML数据分支结构多、数据冗长,给数据的存储和查询带来极大的不便。因此,如何有效的存储和查询XML数据已经成为数据库领域研究的热点问题。为了有效的存储和查询XML数据,更好地推广XML的应用,研究者提出许多XML数据编码方案,这些编码提高了XML数据的存储效率和查询效率,但它们在存储空间的利用率、结点更新效率和查询速度方面仍存在不足,本文就此进行了相关方面的研究。本文深入分析了现有的XML数据编码方法并指出其中的不足,提出了一种支持数据更新的压缩编码方案。该编码方案将结点路径信息进行分解,避免记录重复的路径信息,节省了存储空间;同时支持数据更新,对更新结点的数量没有限制,完全避免了重新编码。本文的主要工作如下:(1)对现有的数据编码和查询技术进行深入的分析。现有编码存储空间利用率不高;不能有效的支持结点动态更新;查询技术频繁使用结构连接操作,查询性能受路径表达式长度的影响。(2)提出一种支持数据更新的压缩编码方案并给出更新方法。该编码方案通过分解结点路径信息,避免了记录重复信息,同时又提高了编码的灵活性,能有效的节省存储空间和支持数据动态更新。(3)提出一种高效的查询方法,该查询方法完全避免了结构连接操作,查询时间不受查询路径长度和中间结果集大小的影响,提高了查询效率。(4)通过实验,将本文的编码方案和已有的编码做了比较,实验结果表明:与已有的编码方案相比,本文提出的编码方案在存储空间利用率、结点更新效率和查询速度方面都有明显的优势。
其他文献
异构数据的集成与交换是信息服务领域研究中的热点问题,异构数据转换则是解决该问题的关键之一。本文针对异构数据转换过程中的数据映射与转换后数据的语义完整性问题,结合专
互联网应用的快速发展,使得网络上的内容越来越丰富,信息的传播越来越快,其中网络中充斥着各个各样的网络流量,Web流量、游戏流量、P2P流量以及网络攻击流量等等,Web网页中的
SAT问题是计算机科学和人工智能研究的领域的著名问题。在实际生活中有许多问题可以转化为SAT问题,并通过SAT算法得到很好的解决。故而研究高效的SAT算法是当前重要且具有实
随着网络技术的飞速发展,对等网络的应用越来越广泛,系统规模越来越大,网络中的资源公平共享问题也日趋严重。P2P是近年来互联网最热门的技术之一,它提供了一种开放的、自由
近年来,随着半导体工艺技术的发展,处理器芯片的集成度也越来越高,单个芯片的处理速度已近乎极限。多核技术成为现在提高处理器速度的一个研究热点,将多个芯片如何协同的工作
伴随着计算机网络的发展,计算机的安全也面临着新的挑战,传统的信息安全方法已不能有效的解决这些问题。人们把生物免疫机理应用到计算机系统和计算机网络安全中,提出了计算
DNA计算的概念由Adleman博士于1994年首先提出,同:时第一次成功使用DNA计算方法解决了7个节点的汉密尔顿路径问题。此后,多种DNA计算模型被提出并用来解决不同的NP完全问题,DN
随着我国社会信息化工作的全面开展,企业、政府单位陆续开发了大量的信息管理系统,但这些信息系统是在不同时期、根据当时不同需求而单独设计、开发出来的,各自面对单独的业
随着信息技术的突飞猛进,产生了大量的视频文档。视频压缩、视频编解码、计算机海量存储和信息高速传输等技术的发展解决了日益膨胀的视频信息传输和存储问题,如何对海量的视
B2C电子商务企业的销售预测直接影响到企业的采购和备库,从而对提高企业客户服务水平、提高企业的市场竞争力发挥举足轻重的作用。B2C电子商务企业和传统零售企业相比,其商品具