论文部分内容阅读
随着人工神经网络、数据挖掘等智能信息处理方法的广泛应用,与之相关的改进算法也不断涌现,不同程度、不同角度提高了算法的性能。但是,随着数据规模的快速增长,人们希望利用自适应思想将用户从繁琐的数据处理流程中解脱出来,并提高工作效率。由Kasabov提出的ECoS(Evolving Connectionist Systems,演化联结系统)有效地融合了自适应自学习的思想,能对大量现有的数据进行快速学习,并且能对新的数据进行增量学习。本文在对ECoS系统研究的基础上,将自适应自学习的思想应用在经典的数据挖掘聚类算法和人工神经网络算法中,以解决算法所存在的某些缺陷。本文的主要研究及工作内容如下:(1)分析和研究了经典聚类算法——k-means算法,提出基于个体轮廓系数的改进k-means算法。改进算法多次调用传统k-means算法进行聚类,根据类中心的个体轮廓系数及各样本与类中心的距离,自适应地选取优秀样本,将获得的优秀样本求其均值作为初始聚类中心;并在UCI数据集上进行实验,验证了其有效性,且较其它优化初始聚类中心的算法在时间上有一定优势。(2)分析和研究了ECoS系统,选择了其中思想简明、处理快速的ECM算法进行重点研究。ECM能够自适应地确定聚类数目和聚类中心,在已有聚类的基础上,对新数据可以直接处理。较传统的聚类方法,ECM算法在处理大数据、利用已有知识、缩短聚类时间等方面都有优势。本文进行了ECM算法增量学习的仿真实验,对其训练模型的生成和新数据的增量处理进行了直观地分析。(3)在基于个体轮廓系数的改进k-means算法的基础上,完成径向基函数神经网络(RBF)中基函数中心的自组织选取,提高了算法选择基函数中心的可靠性,并利用一维模拟数据验证算法拟合函数的有效性,利用多维UCI数据集验证算法分类预测的有效性。(4)将ECM算法应用在径向基函数神经网络中,完成基函数中心的自组织选取,实现了RBF的自增量学习,并且在Matlab中实现ECM与RBF结合后的两阶段学习算法,利用GUI进行自增量学习过程的仿真。(5)对利用ECM算法进行孤立点检测的可能性进行了分析,为高效地进行数据预处理提供了新的思路,对进一步的研究提供了有价值的启发。