论文部分内容阅读
本文介绍了一种全新的有效支持XML结构连接的树索引CAT(CompactAncestorTree)。CAT的基本思想是,对于给定的一个祖先后代查询(简称A-D查询)或Twig查询,遍历XML文档,找出所有的祖先A的实例,用以建立CAT树的主干;对于每个A实例,找出它的直接后代D的实例链接在它的后面。CAT不需要编码。
首先,讨论了针对A-D查询的CAT的建立算法,接着讨论了基于CAT的A-D查询的结果输出,包括按祖先序和按后代序输出。然后介绍了带有小树叉的Twig查询的CAT的建立和结果输出算法,Twig查询分为a[.//b]//c和a//b//c两种情况讨论。因为经典的结构连接算法StackTree算法效率较高且使用较广,因此后面应用基于CAT的结构连接算法和基于StackTree的结构连接算法就A-D查询和Twig查询做了大量实验,实验结果表明,基于CAT的结构连接在大多数情况下性能明显优于基于StackTree的结构连接。由于CAT的运算封闭性,其扩展性非常好,在最后还讨论了CAT的并行算法。