论文部分内容阅读
本文研究了时态XML的数据模型,以及基于此数据模型创建了索引模型,通过创建索引优化了基于时间的查询。本文所做的主要工作和贡献包括:
论文提出了一个时态XML数据模型,该模型将一个时态XML文档建模成一个带有有效时间边标记的有向无环图。提出了基于父节点和入边有效时间的前缀编码方案。并探讨和实现了四种将该数据模型映射到一个具体的时态XML文档的映射方案。并通过实验定性定量地分析了四种映射方案及其适用场合。
论文基于时态XML数据模型,引入节点间的基于时态等价的等价关系和基于时态偏序的拟序关系,创建了一个索引模型VTempXMLIndex。此模型按照路径模式PathLabel分为若干个模式类,所有符合某个路径模式的从根到叶节点的路径会放在这个类中,每个路径模式类按照路径从根节点到叶节点分层形成层节点,每个层节点的基本特征是具有二重嵌套的索引框架,即在由时态等价关系确定的等价类中进一步建立由时态偏序关系确定的拟序关系,使得针对有效时间区间的二维(有效时间的开始时间,有效时间的结束时间)查找变成了一维的查找,查找的效率得到了大大提高。论文首次基于Allen的13种时间区间/点的关系,设计了针对时态XML文档值和结构的查询和更新的算法,并通过理论分析对比了没有经过节点时态过滤优化的查询算法和采用节点时态过滤优化的查询算法的效率。本文还提出了一种采用前缀编码结合hashmap的方法大大地提高了祖先/子孙匹配效率。
论文按照VTempXMLIndex应用实现的基本思路,设计和实现了基于VTempXMLIndex索引模型的查询和更新算法,并通过和目前时态XML索引中性能较好的算法相比,实验结果表明,基于VTempXMLIndex的时态查询和更新算法是可行的和高效的,能适于数据量多达50M的情况,而且随着数据文档的增大,查询时间的增长趋势也是线性的。而且本算法随着查询语句含有的时态约束越多过滤掉的节点越多时,查询效率越高。