基于ECoS的自适应自学习聚类算法的研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:liyibo6941
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工神经网络、数据挖掘等智能信息处理方法的广泛应用,与之相关的改进算法也不断涌现,不同程度、不同角度提高了算法的性能。但是,随着数据规模的快速增长,人们希望利用自适应思想将用户从繁琐的数据处理流程中解脱出来,并提高工作效率。由Kasabov提出的ECoS(Evolving Connectionist Systems,演化联结系统)有效地融合了自适应自学习的思想,能对大量现有的数据进行快速学习,并且能对新的数据进行增量学习。本文在对ECoS系统研究的基础上,将自适应自学习的思想应用在经典的数据挖掘聚类算法和人工神经网络算法中,以解决算法所存在的某些缺陷。本文的主要研究及工作内容如下:(1)分析和研究了经典聚类算法——k-means算法,提出基于个体轮廓系数的改进k-means算法。改进算法多次调用传统k-means算法进行聚类,根据类中心的个体轮廓系数及各样本与类中心的距离,自适应地选取优秀样本,将获得的优秀样本求其均值作为初始聚类中心;并在UCI数据集上进行实验,验证了其有效性,且较其它优化初始聚类中心的算法在时间上有一定优势。(2)分析和研究了ECoS系统,选择了其中思想简明、处理快速的ECM算法进行重点研究。ECM能够自适应地确定聚类数目和聚类中心,在已有聚类的基础上,对新数据可以直接处理。较传统的聚类方法,ECM算法在处理大数据、利用已有知识、缩短聚类时间等方面都有优势。本文进行了ECM算法增量学习的仿真实验,对其训练模型的生成和新数据的增量处理进行了直观地分析。(3)在基于个体轮廓系数的改进k-means算法的基础上,完成径向基函数神经网络(RBF)中基函数中心的自组织选取,提高了算法选择基函数中心的可靠性,并利用一维模拟数据验证算法拟合函数的有效性,利用多维UCI数据集验证算法分类预测的有效性。(4)将ECM算法应用在径向基函数神经网络中,完成基函数中心的自组织选取,实现了RBF的自增量学习,并且在Matlab中实现ECM与RBF结合后的两阶段学习算法,利用GUI进行自增量学习过程的仿真。(5)对利用ECM算法进行孤立点检测的可能性进行了分析,为高效地进行数据预处理提供了新的思路,对进一步的研究提供了有价值的启发。
其他文献
行人检测是目标检测的一个分支,它旨在将行人从连续的视频帧或单帧图像中准确的定位并分割出来,是计算机视觉领域最为活跃也最富挑战性的课题之一。本文对行人检测算法的研究,旨
在信息化程度高度发达的今天,随着高技术武器的不断发展和致伤武器的多样化及其在战争中的广泛应用,不但导致短时间内出现大量的伤病员,而且使得伤情变得复杂。这对长期处于和平
在云存储环境下,如何高效、动态地完成多副本数据的完整性审计是一项极具挑战性的问题。数据所有者为了节约存储成本,通过远程服务将数据外包存储在云服务端。由于云服务提供
现今的大多数数据挖掘算法更偏重于发现大部分数据的模式匹配,却不太深入研究那些偏离模式的特殊数据对象。然而恰恰就是这些罕见事件、特殊对象、异常信息的价值有时候往往会
近些年,计算机辅助语言学习发展迅速,并且受到了越来越多的学者广泛地关注。该学科主要通过计算机和信息技术的辅助来推进简单的外语教学活动。但事实上却很少有能够用于外语口
在信号处理领域中,主动噪音控制的任务就是在受到干扰和噪声污染的信号中提取有用信号。自适应滤波能够实时地调整自己的滤波参数,以满足某种最佳准则的要求。自适应滤波算法
近年来随着生物医学工程的迅猛发展,测量技术的提高使得大量的医学信息以电子格式被记录下来,这些信息不仅包括CT影像,X光片,各项生理指标还包括病人的年龄,性别,体重,身高,既往病史
在生物领域,对DNA与蛋白质相互作用的研究是对基因表达与调控进行了解的重要手段。随着ChIP-seq技术在这些领域的应用日益广泛,如何对大量Chip-seq数据进行处理分析并获取生物
网页与电子邮件中的图像经常嵌入一些文字信息。以图像作为文字的载体源于许多需求,例如美化页面标题和文章标题,广告中吸引人们的注意,还有一些隐藏信息如垃圾邮件中的不良文本
在数字高程模型(Digital Elevation Model,简称DEM)数据上进行路径搜索和地貌类型的划分是数字地形分析在地理学、地貌学以及地理信息科学中研究的热点问题,在人类生产、生活