时态XML索引研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:ua8722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了时态XML的数据模型,以及基于此数据模型创建了索引模型,通过创建索引优化了基于时间的查询。本文所做的主要工作和贡献包括: 论文提出了一个时态XML数据模型,该模型将一个时态XML文档建模成一个带有有效时间边标记的有向无环图。提出了基于父节点和入边有效时间的前缀编码方案。并探讨和实现了四种将该数据模型映射到一个具体的时态XML文档的映射方案。并通过实验定性定量地分析了四种映射方案及其适用场合。 论文基于时态XML数据模型,引入节点间的基于时态等价的等价关系和基于时态偏序的拟序关系,创建了一个索引模型VTempXMLIndex。此模型按照路径模式PathLabel分为若干个模式类,所有符合某个路径模式的从根到叶节点的路径会放在这个类中,每个路径模式类按照路径从根节点到叶节点分层形成层节点,每个层节点的基本特征是具有二重嵌套的索引框架,即在由时态等价关系确定的等价类中进一步建立由时态偏序关系确定的拟序关系,使得针对有效时间区间的二维(有效时间的开始时间,有效时间的结束时间)查找变成了一维的查找,查找的效率得到了大大提高。论文首次基于Allen的13种时间区间/点的关系,设计了针对时态XML文档值和结构的查询和更新的算法,并通过理论分析对比了没有经过节点时态过滤优化的查询算法和采用节点时态过滤优化的查询算法的效率。本文还提出了一种采用前缀编码结合hashmap的方法大大地提高了祖先/子孙匹配效率。 论文按照VTempXMLIndex应用实现的基本思路,设计和实现了基于VTempXMLIndex索引模型的查询和更新算法,并通过和目前时态XML索引中性能较好的算法相比,实验结果表明,基于VTempXMLIndex的时态查询和更新算法是可行的和高效的,能适于数据量多达50M的情况,而且随着数据文档的增大,查询时间的增长趋势也是线性的。而且本算法随着查询语句含有的时态约束越多过滤掉的节点越多时,查询效率越高。
其他文献
学位
电除尘技术作为一项高科技大气污染治理技术,以其除尘效率高、能耗低、可处理大烟气量气体的特点得到不断的发展和广泛的应用。然而由于运行维护管理不佳,致使大部分电除尘器未
随着科学技术的进步,现代信息检索所处理的对象和规模都有了很大的变化。人们迫切需要一种能够快速而且准确地查找访问图像的技术,这就是图像检索技术。图像检索的过程反映的
现代软件开发都要把整个系统按功能分解为小的单元,然后组合这些单元为一个完整的系统;但是系统中有很多非核心需求,这些需求无法很好地封装在单个模块中,它们分散在整个系统
人类基因组计划启动以来,越来越多物种的基因序列被测出,积累了大量的基因序列信息。与此同时各种蛋白质一级结构,即多肽链的氨基酸残基的排列顺序也在不断被探测出来。这些
人脸是人类最具表达能力的部分,其复杂的特征结构使得人脸建模一直是计算机图形学领域中一个极具挑战性的课题。基于颅骨的人脸建模技术是三维人脸建模技术的分支,主要应用于
随着网络流量不断增长,网络尤其是全流量被动测量必须面对海量数据。解决海量IP流数据TRACE的分析、管理的方便性和合理性,改善TRACE使用效率就成了一个迫切需要解决的难题。目
面向服务的体系结构以其松耦合特性在软件架构领域起着越来越重要的作用。它是一个组件模型,它将应用程序的不同功能单元封装为服务,通过这些服务之间定义良好的接口和契约联
日益增长的海量数据使得信息集成日益重要,数据存储的异构性成为一个热点研究问题。信息集成技术有很多现有的方法,本文使用了基于Mediator和Wrapper机制的方法实现了信息集
多媒体信息已经成为了网络重要的传输内容,而流媒体技术凭借其自身的优势在网络上得到了迅速发展。目前主流的流媒体系统主要有两大类:基于P2P技术的和基于CDN技术的。P2P技