论文部分内容阅读
在数据集成环境中,一致性查询应答技术是一项管理非一致性数据的有效技术,它能在保持源数据不变的条件下,查询到要求的一致性查询结果CQA(consistent query answer)。目前CQA的计算方法有冲突图、逻辑编程和查询重写三种方法,本文主要研究查询重写方法。现有的查询重写方法没有考虑有连接的聚集查询重写策略,应用有限。
本文提出了非一致性数据的有连接的聚集查询策略MRRA。文章首先总结分析了非一致性数据领域近年来的相关研究成果和发展情况,讨论了非一致性数据的无聚集的连接查询和无连接的聚集查询策略,分析了这些策略中键和非键属性的投影和连接特点、规律。然后结合上述两个策略,文章分析了一个非一致性数据库事例的有连接的聚集查询的过程。最后,本文提出非一致性数据的有连接的聚集查询策略。
该有连接的聚集查询策略考虑连接图是树的查询,并考虑在关系的键和非键属性上同时投影。该策略先通过查询出多个关系上的一致性结果,然后对这些结果进行分组、聚集查询,最后考虑返回聚集表达式的边界值。
最后,本文用实验对该有连接的聚集查询策略进行了评价。实验采用了TPC-H规范的现有查询来进行查询重写的性能研究。实验对比了不同查询在不同尺寸数据库上的执行时间,结果表明重写查询比初始查询的执行时间要长,但还是可以接受的,因此该方法是有效的。