完全支持数据更新的XML压缩编码

被引量 : 0次 | 上传用户:liuhaichao811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,XML被认为是互联网上的数据表示和数据交换的标准,并被大家广泛接受,越来越多的网上资源以XML的格式来表示。如何对这些XML数据进行有效的管理就成为一个重要的研究内容。在管理XML时,编码和索引技术至关重要。研究者提出了多种XML编码方法,这些编码和索引技术提高了XML数据的存储效率和查询效率,但它们存在一个共同的不足就是:当XML频繁地发生诸如删除、插入等更新操作时,需要重新建立索引或重新编码,更新代价极大。本文就此进行相关方面的研究。本文在深入分析现有XML编码方法的基础上,针对其不足提出了一种新的压缩编码方法-FAPE(Fraction And Path Encoding)。本文的主要工作如下:1)提出了一种新的XML编码方法,该编码方法利用了分数特点和路径编码方案的优点,支持两结点间的无限更新,而不需要二次编码。2)编码占用存储空间小。该压缩编码方案将结点名,结点值和结点路径名分别保存在不同的表中,并将其编号,这样可以避免记录相同的结点名,结点值和结点路径名,提高了存储空间的利用率。3)查询效率高。该编码将每一个结点的路径保存在一个表中,并将其路径编号,避免了以往查询算法的结构连接,且不受路径表达式长度和中间结果的影响。4)通过实验验证了FAPE的有效性。实验表明,不管在空间性能,插入结点所花的时间,还是在数据查询的效率方面,FAPE相对其它的编码都具有优势。
其他文献
近二十年来,随着新的零售业态的不断涌现以及大规模连锁经营方式的全面推广,全球零售业发生了巨大的变革,特别是出现了一些即控制国内市场又积极向海外扩张的零售巨头,随着他
葡萄作为世界重要经济水果,病害是引起葡萄减产的重要原因,用化学防治的方法增加生产成本,降低葡萄的品质。利用抗病资源培育抗病品种是解决这一问题的有效途径。我国野生葡萄资
中亚天然气管道作为我国第一条天然气陆路进口通道,项目建设具有途经国家多、建设时间紧、协调难度大、人力资源紧张、管材运输困难、标准规范不一致、语言交流不畅通等特点
从川端康成的成名作《伊豆的舞女》入手,结合小说的思想内容、人物形象和艺术风格等等,分析了川端康成审美意识中的物哀之美与幽玄之美。并追根溯源,论证了川端康成的审美意
公司的主要特征之一在于其营利性,即公司通过经营活动获取利润,并将其利润分配给公司股东。当前规范我国公司利润分配的是《公司法》和以《企业财务通则》、《企业会计准则》
我国人多地少,耕地后备资源不足,特别是近年来社会经济飞速发展,城镇化、工业化建设步伐加快,建设用地需求进一步增大,人均耕地面积和耕地总面积不断下降,耕地总量动态平衡难
<正>春季易过敏春深四月,群芳斗艳,进入过敏高发季,皮疹与瘙痒严重影响了敏症者的生活。体质过于敏感的人群,其免疫反应的灵敏度超出了应有的程度,即通常会将一些对人体不会
任何学习的发生都是需要条件的,包括内部条件和外部条件。教师在教学过程中的作用是提供合适的外部条件以满足学生学习发生需要的内部条件。化学基础理论是中学化学教学的核
近年来,电子商务在全球蓬勃发展,作为一种新兴的商业运作模式,电子商务代表了未来贸易的发展方向。它不但改变了消费者或者企业进行交易的方式,对跨国企业内部信息的沟通和运
本文彻底推翻了原则与参数体系下的寄生语缺研究论断,运用广义推导理论分析了寄生语缺的生成原因,揭示了寄生语缺与所谓允准性语缺之间的反成分统制关系.我们发现,寄生语缺是