论文部分内容阅读
本文在前人研究的基础上,结合国内外的最新发展动态,通过大量的资料采集、整理和分析,结合具体实例对XML数据库技术的存储和查询领域及其应用进行了分析和研究。本文中还用实验的方法把XQAD算法的性能同其他XML查询算法做了比较,实验结果表明在查询表达式中谓词结构较少的情况下,XQAD算法性能上有较大幅度的提高。在XML存储方面,本文提出了一种新的本源XML存储策略—ECPST,与其他存储策略相比,ECPST的特点在于它利用路径模式树中的模式信息来对XML进行存储。ECPST把对应到路径模式树的同一个结点的元素聚类,并把它们存储在一起。
本文中用实验的方法把ECPST同其他存储策略做了比较,实验结果表明对于含有环节构的XML文档,ECPST可以有效的减少查询时的I/O次数,提高查询的效率。在上述研究基础上,设计并实现了一个简单的原型系统—NSPST,在该系统中,我们以从蛋白质数据库SWISS-PROT上下载的XML数据文档为例,把它按照ECPST存储策略进行存储,并提供查询功能,验证了ECPST在实际应用中的作用。