论文部分内容阅读
在分布式数据库中,系统的性能受查询策略的影响,而一个查询的处理代价通常是由进行通信的信息量来决定。半连接方法可以减少通信数据的传输量。分布式数据库具有并行处理子查询的能力。本文将从两个方面探讨优化措施:响应时间的最小化和总时间的最小化。一些学者对分布式查询处理已经做了大量的研究,但这些算法在某些方面存在一定的局限性。具体的体现在:受到传输媒介的影响,数据和信息在传输中将会受到一定的阻碍,这样的延缓就会减慢整个查询执行过程;计算机设备不断的更新,多处理器在网络环境中已经得到了广泛的应用,应该充分利用其提供的并行处理的机会,这样就可以增加每次传输的数据信息量,加快查询响应的速度;有些算法为了实现某些功能而丧失了一些的关键性能,例如:为减少时间、空间复杂度,采用随机的手段获取缩减操作序列。通过阅读大量文献,以及在实习的过程中对遇到的一些实际问题的思考、解决,这篇文章主要完成了以下的一些工作:1.本文主要研究、探讨了普通半连接的优化算法,提出了一种基于半连接的改进的查询优化算法-------基于标记二次半连接的查询优化算法。实验证明,该查询优化算法明显地减少了中间结果,有效地降低了整个网络通信费用,提高了查询的效率。2.在分布式数据库中,针对分片和分配对查询影响的问题,本文在研究了其相关技术后,提出了基于分片的动态分配和复制的优化算法,并给出了算法的逻辑实现和性能分析。3.考虑到分布式数据的特点,数据在不同的站点分布,各个站点的终端用户要访问的数据不一样。本文提出的基于数据库设计的查询优化启发式算法减少了通信的数据量,优化了查询的执行过程,降低了网络通信的总成本。最后,通过相关的实验,从不同侧面进行比较显示:较之以前的算法,本文提出的优化算法在性能方面有了很大的提高,减少了通讯的信息量,提高了程序的并行性。