论文部分内容阅读
集合类型是一种很常见的数据类型,现实世界中的很多关系均可以用集合类型描述,为此数据库界一直在研究这种关系的存储和表示方法,在关系数据库模式设计中将其作为嵌套关系进行处理或将其分解成多个关系进行存储,面向对象数据库系统和对象关系数据库系统出现以后,集合类型被直接加入到数据模型和查询语言中。由于集合类型结构同原子类型有很大的差别,原来的查询和索引技术对集合类型数据都不适用了,而目前还没有成熟的索引结构,所以目前在数据库应用中很少使用集合类型。
本文提出了集合类型数据的一种索引结构:Set_tree,Set_tree通过合并集合数据的公共前缀组织数据,这种方法可以减少重复数据和重复模式的存储空间,第三章介绍的基于Set_tree的集合联接算法提高了集合数据上的联接操作的性能。在第四章,我们把Set_tree应用到XML查询系统中,针对关系数据库存储XML中的集合元素时,将具有集合包含语义的XML查询转换成关系数据库上的查询需要做联接,查询效率不高的问题,提出了一种新的解决方案,即将XML查询分解成非集合包含语义和集合包含语义两部分,并由关系数据库查询引擎和集合包含算法分别执行,最后将两部分的结果加以综合。