XML编码及其结构连接算法的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lcb225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML查询处理技术,目前普遍采用的是路径分解和一次一集合的匹配方式,这种处理方式在效率上明显优于传统的导航式遍历方式。在这种处理方式中,节点编码和结构连接是非常重要的两种技术,在查询处理中起到决定性作用。为提高查询处理的效率,本文提出了一种新的XML编码方案,即BTB编码,并在此基础上提出了基于BTB编码的结构连接新算法——BTBContainJoin。论文分析了已有编码的不足,借鉴了哈夫曼编码的思想,提出了一种新的基于二叉树的编码形式。这种编码形式用一个二进制位保存一条边的路径信息,每个父节点编码都是其子节点编码的前子串。因此,可以根据编码的字符串操作判断节点的关系,并且可以根据节点长度判断它在二叉树中的层次,不需要另外保存层次信息。新的BTB编码把XML文档树转化为二叉树,并按路径编码。编码采用二进制串形式,每个二进制位代表了二叉树中的一条边,以保存节点的路径,支持包含关系的结构判定。优化的BTB编码引入了下移标识字符,来支持父子结构关系和兄弟结构关系的判定。BTB编码具有类似于前缀编码的性质,保存了节点的路径信息,但在存储代价上明显优于前缀编码。实验表明,BTB编码具有较好的CPU性能,且编码长度较短。论文通过分析已有的结构连接算法的不足,利用划分的思想,分析了对BTB编码空间的划分方法,提出了一种新的基于划分的结构连接算法BTBContainJoin。新算法基于BTB编码提出,以划分为核心思想,先对编码空间进行划分,然后以此为依据对输入集合进行划分。划分后的结构连接操作在子集合间执行,子集合的连接结果合并起来即为整个结构连接的结果。该算法不需要对输入数据排序,节省了时间和空间开销。实验表明,BTBContainJoin算法具有较好的CPU性能。
其他文献
随着信息技术的飞速发展和计算机应用水平的不断提高,医学成像技术也在飞速发展,人们可以获得大量高分辨率的医学影像,我们需要从这些医学影像中提取出我们需要的信息。然而,
当今,人们生活在无线网络时代,无线设备无处不在,移动电话成为人们生活中不可分割的部分。人们每天使用手机做不同的事,不仅用来与其他人聊天发短信,还用来检索他们所需的各
进入21世纪以来,社会不断的发展、人们的物质生活有了很大的提高,人类疾病的问题也在不断增加。偏瘫患者大多由脑卒中疾病引起的,且发病率呈现上升趋势,偏瘫患者生活不能自理
随着信息技术和数据库技术的不断发展,数据库中存储的数据种类和数量急剧增加,使得如何从海量数据中快速有效地提取有价值的信息变得至关重要。数据挖掘技术应运而生。适当的
本体主要用来描述概念以及概念间关系,并在人工智能、Web语义、电子商务和Web异构信息处理等多个领域得到了很好的应用。但目前的本体基本上都是手工构建,这是一项繁琐而辛苦
审计行业所需知识主要涉及审计过程中必须具备的审计知识、会计知识、业务知识和计算机知识等专业知识,以及经验、技能等非专业知识,知识涉及面较广。审计人员只有综合运用这
煤矿虚拟现实的问题一直是国内煤矿行业研究的重点和难点。近年来虚拟现实技术在煤矿中应用也越来越广泛,并取得了较好的成果,而且利用虚拟可视化技术创建出逼真的三维巷道以
Gabor变换在信号处理领域一直被认为是一十分有用的时频分析工具,然而,却因Gabor变换算法(即求解信号的Gabor变换系数和逆变换重建原信号)的高计算复杂性而限制了其实时应用
随着通信技术和多媒体技术的发展,网络视频服务逐渐成为人们生活和工作不可或缺的重要部分。视频点播是一种可以按照用户需求点播节目的交互式视频系统。它改变了用户被动的接
电力企业作为资产密集型企业,它的资产管理对提高企业的经济效益,提升企业的竞争力具有举足轻重的作用。由于其资产设备多、资产管理子模块之间交互频繁等特点,加之原有的面