论文部分内容阅读
在当前的网络信息时代,数据信息不仅庞大而且呈多样化。为了充分利用Web上的数据信息,信息集成已经成为一种必然的要求。XML作为兼具可扩展性及灵活性的通用数据传输格式,越来越多地被用来表示异构数据以消除多数据源的不一致性,以达到信息整合的目的。
但是在信息集成环境下,数据的存储和传输将是海量的。因此,如何优化XML数据的查询检索是迫切需要解决的问题。而对常用的数据信息建立物化视图是提高对XML数据查询分析的一个重要手段。
本文提出了一种XPath物化视图增量维护方法,并提出了XPath物化视图增量维护代理的系统框架。在此基础上,本文重点对支持XPath物化视图增量维护的一些关键技术进行了深入地探讨。
在增量维护代理的并行处理机制这一关键技术上,本文应用分布式系统的原理对系统进行了设计,并使用多线程技术实现了系统中负责调度与管理的增量维护管理器模块,为系统工作的高效并行处理提供了技术保障。
在增量更新程序的版本维护这一关键技术上,本文提出了增量更新程序的存储结构的设计方案。其中提供多客户共享增量更新程序队列机制,并且在上述存储结构的基础上,制定了增量更新程序的版本维护策略。
在XPath查询这一关键技术上,本文引入了基于路径匹配自动机的XPath查询匹配技术。并为路径匹配自动机模型作了形式化定义,阐述了由XPath表达式到路径匹配自动机的转换规则,以及SAX解析事件流上路径匹配自动机的执行规则。