论文部分内容阅读
网络技术,数据库及数据仓库技术的飞速发展使得数据大量堆积,为从大量数据中发现隐含的知识信息,数据挖掘技术得以出现。随着数据量的急速增长及人们对隐含知识的迫切需求,数据挖掘技术得以飞速发展。分布式数据挖掘使用分布式计算技术,从分布的数据库,数据仓库等数据集中发现用户需要的知识,为用户的决策提供信息支持,具有极大的应用前景。正是基于这种大众价值需求的分析及数据挖掘技术的发展的需要,在仔细研究了Agent及多Agent技术之后,本文就在Agent及数据挖掘两者间找到一个有效的切入点。自20世纪90年代以来,Agent及多Agent技术逐渐成为学者们的研究焦点,它的新思想,解决问题方案对许多科学技术的发展产生了深远的影响。由于Agent具有自主性、主动性、交互性和针对环境的适应性等技术特性,多个独立的Agent共同完成分布式数据挖掘任务这一想法也就自然而然的在学者们头脑中浮现。这样,整合了对多个Agent管理的多Agent技术就非常适合复杂的分布式问题求解,同时数据挖掘技术由集中式迈向分布式也是数据挖掘的必然走向。本文正是基于这个思想,设计了一个基于多Agent协作交互的数据挖掘系统,系统中数据挖掘Agent分布在网络中不同地域的数据集上,各个站点的数据挖掘Agent按UAgent分配的任务进行相应的数据挖掘,UAgent在全局数据挖掘管理Agent (ManagerAgent)的管理控制下进行数据挖掘,结果首先传送给直接管理数据挖掘Agent的UAgent,之后再传送回ManagerAgent,由ManagerAgent控制管理结果集或将满足用户需求的整理好了的结果集输送给用户。系统中Uagent及ManagerAgent中结果集处理是一个复杂的过程,具体如何控制在本文的系统实现篇有详细的解析。这样系统就避免了不同站点待挖掘数据的移动,同时能高效地实现分布式并行计算。论文首先总结了当前数据挖掘技术、Agent技术及多Agent技术的发展现状;接着进一步分析了数据挖掘技术发展趋势;之后结合多Agent技术优势,通过多Agent技术及分布式数据挖掘技术的优势互补,设计了一个基于多Agent协作交互的数据挖掘系统结构;之后在此结构基础上完成了系统各功能模块的伪代码实现:最后运用关联规则挖掘方法对系统进行模拟实验测试并分析结果。