【摘 要】
:
随着互联网等现代信息技术的飞速发展,人们必须面对海量的信息,如何对这些信息进行整理、分类和挖掘成为人们日益关心的话题。聚类分析技术作为一种信息处理手段近些年来一直
论文部分内容阅读
随着互联网等现代信息技术的飞速发展,人们必须面对海量的信息,如何对这些信息进行整理、分类和挖掘成为人们日益关心的话题。聚类分析技术作为一种信息处理手段近些年来一直受到人们的关注,而且在机器学习、模式识别,数据挖掘、信息检索等很多领域得到了广泛的研究和应用。聚类算法主要分为基于划分的聚类算法和基于层次的聚类算法,基于划分的聚类算法是数据挖掘中最常用的算法,K均值算法和模糊C均值聚类算法(FCM)作为两种重要的划分算法在实际中广为应用。但它们都存在三个缺点:类中心个数需要用户预先指定;容易收敛到局部极小值或鞍点;聚类结果受初始类中心影响较大。为了解决这几个缺点,本文提出了基于进化规划的K均值算法(KEP)和基于进化规划的FCM算法(EPFCM)两个算法。利用进化规划的全局优化能力,KEP算法避免了K均值算法易陷入局部极值和受初始类中心影响大两个缺陷。实验表明,与K均值算法相比,KEP具有的显著的聚类效果;与基于遗传算法的K均值算法(KGA)相比,KEP具有更快的速度和更优的聚类效果。在EPFCM算法中,借助聚类有效性指标对聚类结果的评价和进化规划算法的全局优化能力,用户无需预先指定类中心的个数,算法可以搜索到最佳的类中心个数及其对应的最佳聚类结构。为了加快算法的收敛过程,我们在进化规划的迭代过程中加入了FCM算法的迭代步骤,为了能找到最佳的类中心个数,我们采用Modify算法动态改变类中心个数。实验表明,EPFCM算法可以有效地得到最佳的类中心个数,聚类结果不受初始类中心影响,并且陷入局部极小的概率较FCM算法大大降低。
其他文献
软件开发的形式化方法被当今计算机界誉为克服“软件危机”,提高软件可靠性和生产效率的革命性途径。形式化开发方法中,人们利用软件的规格说明来描述计算机“做什么”。目前Z
汽车销售管理是20世纪中期发展起来的一门新兴学科。随着我国经济的持续发展,汽车销售已经成为热门行业,人们对汽车消费的要求也越来越高,汽车销售的管理也变得越来越重要。毕竟
随着各电子政务网以及大型企业网内部信息和资源共享越来越多,则迫切需要一种性能良好的VPN组网模式来解决其信息交互过程中的各种问题,而基于MPLS技术的VPN组网模式利用其灵活
传感器节点能源受限是传感器网络应用中一个亟待解决的关键问题。研究表明,传感器节点的能量主要消耗在无线通信过程中,传感器网络中的冗余数据常常给传感器节点带来不必要的能
随着的下一代操作系统Vista的发布,Microsoft推出了一系列新的技术和标准。其中的一个就是被称作XPS(XML Paper Specification)的全新的电子文档技术。XPS是微软新一代基于XM
随着计算机网络和全球信息化的不断发展,计算机网络信息安全随之成为一个重要的问题。因此,需要一种能及时发现入侵,成功阻止入侵的网络安全技术,这就是入侵检测技术。本文首先介
无线局域网随处可见,已经成为我们生活的一部分,但无线网络安全空间仍然乌云密布。2013年的“棱镜门”事件已经持续发酵了一年多,这让人民震惊,开始重视个人网络的安全问题。
目前因特网发展出现瓶颈的原因之一是由于没有赋予网络上的全部资源足够的语义信息。最主要的原因在于,现在的网络主要是基于超链接实现的,网络只是知道如何显示资源,却不清
本文在进行彩色图像文本定位与提取时采用基于边缘的方法。 首先,对彩色图像进行增强处理,提出了一种改进的矢量中值滤波算法;通过将Prewitt边缘检测算子在彩色空间上进行扩
随着我国高等教育的普及高校的扩招,造成如今高校毕业生就业形势逐渐严峻。当前对高校毕业生的就业状况分析较为简单,大多仅仅按学校就业率和专业就业率进行评价,显得片面缺乏科