动态XML编码技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:sunzhiqiang7310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络应用的快速发展,XML(eXtonsible Markup Language)数据正成为主流的数据形式,如何对XML数据建立有效索引进而实现高效查询是当前的研究热点。大部分XML相关索引和查询技术基于某种对XML树的编码方法。XML编码方法保存了文档树的结构信息,使得在执行查询时不必遍历整个XML文档。传统的区间编码方法和前缀编码方法支持XML节点间位置关系和结构关系计算,但是不能有效处理文档更新,一旦更新发生,整个树需要重新编码,系统代价高。为解决该问题,研究人员提出了动态XML编码方法,包括浮点数区间、CDBS(Compact Dynamic Binary String)、QED(Dynamic Quaternary Encoding)以及DDE(Dynamic Dewey)等。动态XMK编码方法一定程度上避免了文档更新时的重新编码,但仍存在时空开销大、对倾斜插入敏感、不能重用已删编码等问题。本文研究集中于动态XML编码机制的性能优化。XML首先,XML文档更新涉及节点插入和删除,当在删除位置插入新节点时,如果新节点能够对已删编码进行重用,则可以控制编码长度的增长速度,提高查询性能。CDBS和QED的编码重用已经有相关研究,而对于DDE编码,却是一个难点。基于Stern-Brocot树,提出了DDE编码的改进方法——IDD(ImprovodDDE)。IDD将最短位长中间编码赋予新节点,能够对已删编码进行重用,有效控制了删除和操作都发生的更新环境下DDE编码位长,提高了XML频繁更新时的编码效率和查询性能。   此外,针对已有动态区间编码方法普遍存在的初始编码空间复杂度高,倾斜插入编码长度增长迅速等问题,本文提出了新的适用于XML文档更新环境下的区间编码方法-DCLS(Dynamic Containment Labeling Scheme)。DCLS利用整数进行初始编码,具有计算简单,额外空间复杂度低、存储效率和查询性能高等优点;同时,DCLS将整数视为特殊向量,不仅支持文档更新,而且更新效率高,特别是倾斜插入时,DCLS可以避免编码位长的快速增加。   实验结果表明,相比于已有动态XML编码方法,IDD和DCLS有更好性能。XML  
其他文献
当前,嵌入式系统已广泛应用在各行各业。嵌入式微控制器作为嵌入式系统的核心,正处于迅速发展阶段。要想在嵌入式微控制器上建立各种应用,首先得为其开发相应的编译工具链。汇编
机动目标跟踪技术在军事和民用领域上有重要的应用价值,受到了学者的广泛关注。目前,随着科学技术的不断发展,目标的机动越来越复杂,如何提高复杂的机动目标跟踪性能尤为重要
油田地质体三维展示中空间对象的可视化一直是地学关注和研究的重要领域,也是多尺度三维地质体数字表征关键技术研究及应用的重点攻关内容,其目标在于实现三维地质体的数字表征
物联网技术是一种综合性技术,它包括了传感技术、无线通信技术、网络技术、嵌入式技术以及海量数据处理技术等诸多支撑技术。物联网技术的核心思想是利用传感技术采集现实环境
复合材料的图像分析是近年来国内外一个比较活跃的研究领域,其研究发展对于推动材料制造业的发展起到了非常重要的作用,有着广阔的应用前景。本文主要应用基于多样权值的离散距
近年来,随着计算机、网络、微电子等技术的快速发展,监测系统在工业、农业、环境监测等领域应用越来越广泛。监测系统主要由数据采集硬件设备和监测软件构成,然而,近年来监测系统
在现实世界中,往往存在着许多动态的多目标优化问题,由于此类问题具有多个依赖时间或环境的目标,并且这些目标可能是相互冲突、不可公度的,加之此类问题的最优解会随着时间而
序列模式挖掘是数据挖掘领域中一个活跃的研究分支,有着广泛的应用前景,如顾客购买行为习惯分析、Web操作分析以及生物序列分析等,目前已经得到了广泛地研究。   但随着信息
随着农业技术的不断发展,水稻栽培技术已经从追求高产的单一目标朝着高产、优质、高效、生态、安全的综合目标迈进,一种新型的水稻栽培技术也随之产生,即水稻精确定量化栽培技术。同时,信息化技术的深入使得有关农业决策等农业信息化管理系统也日趋完善,从而产生了大量与农业相关的业务数据。传统的应用中,这些数据大部分只能简单地存储在数据库中,隐含在历史性数据中的潜在信息被闲置,没有得到充分的利用,造成了极大的信息
虽然合作行为广泛存在于自然界和人类的社会系统中,可是根据达尔文的生物进化论,合作并不是一个最优的策略。因此,如何解释合作行为的出现在学术界一直是一个热点课题。其中,