基于Agent的并行群组数据挖掘模型研究与实现

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:dmjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪末,随着信息技术的普遍应用、Internet的普及,信息系统的分布式应用及研究逐渐成为热点,分布式数据挖掘也得到了越来越高的重视。与此同时,分布式数据挖掘模型、分布式数据挖掘算法、分布式数据挖掘工具等方面的研究也相继展开,并取得了一些成果,但也存在诸多亟待解决的问题。Multi-Agent技术被认为是解决分布式数据挖掘的有效方法。在分布式数据挖掘模型方面,数据挖掘工作者提出了几种经典的基于Agent的分布式数据挖掘模型:JAM、PADMA、以及以CDM为基础改进的基于异构站点的集合式数据挖掘系统BODHI等。这些模型为研究分布式数据挖掘,起到过积极的推动作用。随着Internet的发展和普及,分布式应用出现了新的特征:数据站点数量庞大,随时扩展新数据站点,数据更新频率高,跨越距离大。如何对这样的分布式系统进行有效的数据挖掘成为一项紧迫的任务。经典模型在应对这些新型分布式系统时,显得力不从心。文章在研究Multi-Agent技术的基础上,分析经典的基于Agent的分布式数据挖掘模型的优缺点。通过改进经典模型的缺点,保留优点,运用不同的网络技术作为通讯媒介,旨在设计一种新的基于Agent的并行群组数据挖掘模型——PADMAN。目的在于解决当前出现的数据站点数量庞大、扩展新数据站点灵活、更新数据频率高、跨越距离大的分布式系统的数据挖掘需求。在PADMAN模型的基础上,提出了适用于本模型的数据挖掘结果合并策略。通过两次合并数据挖掘结果,解决了以往模型中出现的主站点负载压力大,网络通讯量较大,控制难度较高的缺点。文章在研究PADMAN模型框架,以及基于本模型的合并策略的基础上,运用Eclips与JADE平台,实现了PADMAN原型系统,以验证模型群组内的协作关系。论文的重点在于对PADMAN模型架构设计、基于PADMAN模型的数据挖掘结果的合并策略,在模型实现方面还略显不足。文章在应对目前出现新特征的分布式数据挖掘方面,提出了一些新的观点,具有一定的参考价值。
其他文献
在虚拟化环境中,虚拟机镜像文件在物理节点上完整地保存了虚拟机运行环境和用户数据。但是,虚拟化带来的语义隔离性使得虚拟机镜像文件保存了虚拟机中所有已删除的数据,这极
人脸检测作为人脸信息处理中的一项关键技术,近年来在模式识别与计算机视觉领域中已成为一个热门的研究方向,具有极高的学术研究价值和商业应用价值。随着智能化信息处理技术
随着Internet技术的不断发展,各种新技术的不断诞生,正在逐渐改变人们的生活与工作的方式。诞生于上世纪九十年代的RSS技术是近几年在互联网上最热门的技术之一,各种类别的信
动态插桩系统在程序的执行过程中动态地插入代码以获取程序的执行信息或扩展程序的功能,它被广泛的应用于程序的性能分析、体系结构模拟和错误检查等。然而,动态插桩系统普遍
近几年开始,CPU主频提高的速度已经越来越慢,硬件厂商开始将CPU的发展方向转变为多核化,Intel、AMD等公司多核处理器的市场占有率也开始不断上升,并且这些处理器中集成的核也
无结构化P2P(Peer-to-Peer)网络在覆盖网上采用了完全分布式的组织方式,无中心管理节点,节点之间的地位完全平等,可以自组织、自管理、能较好的处理节点的动态加入和退出,以及节
随着影像技术和图像应用技术的蓬勃发展,对图像处理的各种要求越来越高,而图像分割作为图像处理和图像分析的重要基础,在近年来得到了广泛地研究与推广。由于细节较多,图像灰
网络虚拟化(Network Virtualization)旨在公共的底层物理网络上建立彼此相互隔离的逻辑网络,每个逻辑网络可以有各自独有的地址格式、寻址策略与控制方式。在传统网络体系结
随着互联网的高速发展,越来越多的信息以电子形态存储和交换,于是信息检索技术应运而生,并且仍在不断的发展和完善。文献检索作为科研人员获取资源信息的重要途径,已经成为信
在大数据时代,信息系统所支持的业务过程产生了海量的事件日志。事件日志在当今的企业中发挥着越来越重要的作用。基于这些事件日志,企业可以进行诸如过程挖掘、血统追踪和复