基于网格的分布式数据挖掘体系结构的研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:jaz23cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和Internet技术的迅猛发展,科研、工业和商业领域所产生的数据正以惊人的速度增加,这些数据集物理上大多分布在不同的地点,但是它们在逻辑上却是一致的。传统的数据挖掘技术可以帮助人们发现海量数据背后的有用信息,但是它们却只局限于对单一数据源的挖掘。另外数据挖掘是计算密集型的应用,对计算环境要求较高。因此,如何对分布式的数据源进行挖掘和如何进行并行挖掘是现在数据挖掘领域研究的热点之一。 网格的出现为分布式应用提供了新的问题解决平台。网格技术在计算密集型、数据密集型以及分布式异构数据整合应用方面提出了很好的解决方案。因此,对于分布式的知识发现应用来说网格技术是一个不错的选择,它对知识发现应用提供了强大的计算能力和分布式异构数据整合的支持。本文提出了一种基于网格的分布式挖掘框架,称为知识发现网格(Knowledge Discovery Grid)。 首先,本文研究了现有的网格技术和数据挖掘技术,并讨论了二者结合的可能性;然后在此基础上提出了一种基于网格的分布式数据挖掘服务框架,并对该服务框架进行了详细设计;接下来本文阐述了服务框架的具体实现方式,并给出了一个具体的挖掘实例;最后展示了在该框架上的性能测试试验,给出了试验结果比较和分析。
其他文献
随着语义网络技术的发展,越来越多的领域运用本体来描述领域内的知识。比如,本体被用于生物工程来描述基因信息,被用于企业内部来描述企业的各种资源,也被用于金融行业来描述
摘要:云计算是伴随着互联网技术的进步而产生的一种以服务的方式提供动态可伸缩的虚拟资源的新型的计算模式。随着云计算的发展,科学工作流将逐渐在云计算中得到应用,目前越来
时间序列分类是时间序列研究的关键部分,为了高分类的准确率以及算法执行的效率,本文出了基于特征采样的时间序列分类方法。时间序列数据往往具有不等长的特性,常规的机器学
随着信息网络技术的飞速发展,传统图书馆的服务已远不能满足人们对知识的需要,特别是在信息服务和知识服务方面。图书馆数字化的逐步推进,让人们能更加快速、准确的获取所需
组推荐算法弥补了传统推荐算法无法给多个人进行推荐的缺点,已经引起了越来越多的研究者的关注。目前的组推荐算法主要分为两种,一种是使用组偏好模型进行推荐,另一种是融合组员
公钥基础设施PKI以非对称加密技术为基础,为网络信息安全提供有力保障。PKI以数字证书为密钥管理工具,终端实体之间进行通信之前必须要验证数字证书的可信性。验证数字证书是否
随着多媒体技术和计算机网络的飞速发展,数字媒体的制作和传播变得更加方便和快捷,同时,盗版和侵权的问题也日益严重。数字水印技术作为一种数字媒体版权保护的有效方法,近年
人脸检测是指通过对输入图像进行分析,确定其中人脸的数目、大小、位置、姿态等信息的过程。人脸检测作为人脸识别的先期工作,是计算机模式识别领域研究热点,涉及模式识别、图像
推荐系统的目的是向用户推荐用户感兴趣的信息和商品。推荐系统工具和技术是现有商业和研究团体的主要研究课题之一,推荐系统通过滤信息后台预言用户是否会对一个特定项目感兴
在社会网络中,团队的形成是一个一直研究的主题。为了提高成功率以及效率,已经形成了很多研究方法和研究方案。论文中基于一个由专业个体形成的较大规模的社会网络子集来完成相