论文部分内容阅读
随着计算机技术和Internet技术的迅猛发展,科研、工业和商业领域所产生的数据正以惊人的速度增加,这些数据集物理上大多分布在不同的地点,但是它们在逻辑上却是一致的。传统的数据挖掘技术可以帮助人们发现海量数据背后的有用信息,但是它们却只局限于对单一数据源的挖掘。另外数据挖掘是计算密集型的应用,对计算环境要求较高。因此,如何对分布式的数据源进行挖掘和如何进行并行挖掘是现在数据挖掘领域研究的热点之一。
网格的出现为分布式应用提供了新的问题解决平台。网格技术在计算密集型、数据密集型以及分布式异构数据整合应用方面提出了很好的解决方案。因此,对于分布式的知识发现应用来说网格技术是一个不错的选择,它对知识发现应用提供了强大的计算能力和分布式异构数据整合的支持。本文提出了一种基于网格的分布式挖掘框架,称为知识发现网格(Knowledge Discovery Grid)。
首先,本文研究了现有的网格技术和数据挖掘技术,并讨论了二者结合的可能性;然后在此基础上提出了一种基于网格的分布式数据挖掘服务框架,并对该服务框架进行了详细设计;接下来本文阐述了服务框架的具体实现方式,并给出了一个具体的挖掘实例;最后展示了在该框架上的性能测试试验,给出了试验结果比较和分析。