XML模式树匹配查询算法的研究与改进

被引量 : 0次 | 上传用户:koalaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML作为Web发展所带来的新技术中的代表,逐渐成为了学术界和工业界所关注的焦点。XML是一种自描述、可扩展的标记语言,广泛地用于Web环境下数据的表示和共享。要搭建各种基于XML的应用,必须提供处理XML数据的核心技术来高效地生成、查询、过滤、变换XML数据。由于XML数据具有不同于传统数据形式的特点,使得传统的数据库技术不能有效地发挥作用,因此需要针对其特点研究新的处理方法。由于XML文档有类似树状的结构,所以和文件路径类似的路径查询表达式是XML数据查询和过滤的基础,同时XML查询也指定了那些在某些特定的树结构关系上的选择谓词的样式。原始的XML树结构关系是父-子关系或者是祖先-后代关系,在XML文档中发现这些匹配关系是XML查询处理的核心操作,在XML文档中找到所有查询模式树的匹配是XML查询代价估计中的核心问题,在本文中重点讨论了模式树匹配的查询优化问题。本文详细探讨了一种典型的结构化连接算法-Twig Join算法,并针对其存在的不足提出了一种基于Ctree索引的模式树匹配算法-PatternMatch算法。通过具体分析可以看出,与Twig Join算法相比,PatternMatch算法能够在XML文档中直接找到一个查询模式树的匹配结果,不会产生无用的中间结果集,而且所有的中间结果集在堆栈中保存起来,通过连接运算能够很方便地形成最后的查询匹配结果,提高了查询匹配的成功概率。本文首先介绍了模式树匹配算法的研究背景和研究现状,回顾了结构化连接算法的研究成果,接着对XML查询语言和XML索引进行了详细的说明。然后引入了模式树的概念,并结合具体算法Twig Join探讨了目前结构化连接算法的缺点,这类算法容易大量无用的中间结果或者对一些子模式树进行重复匹配,下面给出了改进算法PatternMatch,并通过具体的性能分析阐述了算法的优点。最后对论文的研究工作和成果进行一个总结,指出了其中的不足,并对今后进一步的工作进行展望。
其他文献
<正>2018年8月21—22日,教育部关心下一代工作委员会常务副主任、中国教育装备行业协会会长王富到河北调研考察,参加河北省教育装备行业协会(以下简称河北行协)"助力扶贫攻坚
<正> 日前,国家体改委有关权威人士称,中国未来发展将呈现10大趋势:1、股份公司制度,即通常说的股份制成为基本的企业组织制度。2、商品和劳务主要靠市场交易,其形式由低级向
本文简要介绍了湖南某石灰岩矿区的地质特征,讨论了由于矿山开采疏干排水而引发的地面塌陷的基本特征、分布规律及其成因,认为矿区可溶岩发育、地质构造复杂、采坑排水、放炮
曹禺先生的《原野》是一个关于"父债子还"式复仇的戏剧。仇虎的内心所背负的是来自父亲的责任压力,"父债子还"式复仇对他来说,是命运给他安排的不可能完成的任务。这部作品虽然最
以废弃马铃薯渣为原料,经弱碱NaHCO3去除大部分蛋白质和脂肪,经超微粉碎后,采用植酸盐或微波辅助植酸盐螯合提取马铃薯渣中可溶性膳食纤维,通过单因素试验和正交试验确定优化
本研究从运动量的角度考察体育锻炼与考试焦虑之间的关系,以期了解体育院校大学生的考试焦虑水平,并进一步分析体育锻炼运动量与考试焦虑之间的关系,为缓解大学生的考试焦虑
双酚A型环氧树脂因其具有良好的综合性能和工艺性能,在工业各个领域获得了非常广泛的应用,尤其在复合材料、胶粘剂制造中有着不可替代的作用。随着应用领域的不断扩大,改善环氧
目的:研究肾小球系膜细胞对成骨细胞的影响。方法:应用体外细胞培养法,将成骨细胞分为正常血清组和系膜细胞组。检测培养24h、48h7、2h、120h后的成骨细胞增殖情况,并在72h后
钱秋海教授认为亚急性甲状腺炎发病与外感风温、情志内伤及患者体质因素密切相关,并根据亚急性甲状腺炎的发病过程,将其分为急性期(外感风温热毒期)和缓解期(气阴两虚期)分别
在内燃机中,进排气系统的优劣是决定混合气形成、燃烧过程好坏与充量更换的关键之一;进入气缸中的空气量和进气产生的流动状态是对内燃机的动力性、经济性以及排放性能产生重