基于智能优化算法的聚类分析及应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ly12345000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的进步以及数据库应用的普及,数据挖掘技术已经成为近年来国际社会在信息决策领域的重要研究方向之一,同时,也是随着信息技术不断发展而形成的一门新学科。聚类分析作为一种重要的数据分析方法已经成为数据挖掘领域中一个非常活跃的研究课题。聚类分析的方法有很多,在本文中重点介绍了C-MEANS和模糊C-MEANS(FCM)基于划分的聚类方法。但是对初始聚类中心的选择敏感,并且容易陷入局部最优是这两种聚类算法典型的缺点。因而,在本文引入了智能优化算法。智能优化算法是迅速发展起来的对已有一些经典的聚类算法进行优化的行之有效的方法。近年来,发展起来的用于聚类分析的智能优化的算法主要有:基于免疫原理的人工免疫算法、基于进化的差分进化算法、基于蚂蚁系统的蚁群算法、基于遗传学的遗传算法和模拟退火算法等智能优化计算方法。这些算法各有特点,广泛用于解决各类聚类问题。本论文主要利用了基于免疫原理的人工免疫算法、把遗传算法和模拟退火相融合的算法来实现数据聚类并将聚类方法应用到图像压缩即设计矢量量化码书,通过实验验证均取得了有效的结果,主要工作包括以下三个方面:首先,针对传统的克隆选择算法在解决聚类问题中存在着收敛速度慢、聚类效果不佳以及进化聚类算法采用单一的聚类指标的缺陷等问题。将多目标优化思想引入到免疫克隆聚类算法中,根据免疫系统所体现出的局部学习生物特征,在算法中设计了一种新的局部学习算子,并在此基础上提出了基于局部学习算子的人工免疫多目标模糊聚类算法。提出的算法在对人工数据集和UCI数据集聚类的结果表明,该算法能取得较高的聚类正确率其次,针对遗传算法的容易陷入早熟以及模拟退火算法收敛速度慢等缺点,将模拟退火算法融入到遗传算法中,提出基于遗传的模拟退火聚类算法及其在矢量量化码书设计中的应用。鉴于基于划分的染色体实数编码方式的特点以及对染色体的操作细化为对基因的操作,由此提出了新的有效的模拟退火方法、以及交叉操作算子和突变操作算子。同时,算法中采用核空间距离代替欧氏距离,从而使得提出的聚类算法能处理分布复杂的数据聚类问题。在此基础上设计实现了用于自然图像压缩的模拟退火遗传核函数矢量量化算法.实验结果表明提出的算法在大部分的数据集上都能取得较好的结果。最后,针对LBG算法对初始码书较为敏感的缺点,将免疫克隆选择算法引入进来。使用分裂法产生初始码书。又针对基于欧氏距离的相似性度量仅能反映聚类结果的局部一致性特征,而无法反映聚类的全局一致性的缺点,进而提出了使用基于流形距离的免疫克隆选择聚类方法,通过对31组数据的聚类以及设计实现用于自然图像压缩的基于流形距离的免疫克隆选择矢量量化码书设计对聚类效果进行验证。通过实验结果得到了提出的算法相对于其它算法具有良好的性能。
其他文献
聚乙二醇(PEG)、KH2PO4、赤霉素(GA3)和低温处理可以不同程度上提高甜椒二叶一心、四叶一心和六叶一心期的壮苗指数、根系活力、根系吸收面积和叶绿素含量,改善甜椒幼苗的生
在当今世界,企业之间的竞争已日益发展为形象之争,而企业形象定位是企业形象管理与设计的基础.企业怎样进行形象定位,在形象设计定位中,如何把握自我,充分了解消费者所重视的企业形
急性胰腺炎发病机制主要是胰酶在胰腺内被激活,从而引发胰腺组织的自身消化、水肿、出血、坏死,是常见的急腹症,病情较复杂多变。近年中西医结合治疗该病成为主流,针刺是其中
[摘 要] 随着我国经济的不断发展,我国的对外贸易量显著增长,对美贸易顺差不断扩大,外汇储备屡创新高,因此不论是对内还是外,人民币都存在着升值的压力。而人民币升值后影响最大的是进出口贸易。本文以笔者所在的秦皇岛市为例分析一下本币升值后对我市出口贸易的主要影响。  [关键词] 汇率 升值 出口贸易     一、人民币汇率升值的基本情况  2005年7月21日中国人民银行宣布放弃单一盯住美元的汇率政策
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
赣南老区有发展红色旅游的独特优势,但要把优势变成胜势,必须注重品牌建设。本文旨在对赣南红色旅游品牌的创建提出一些建设性的意见,以资参考。
计量测试是机械制造的基础支撑。自20世纪70年代率先在国内开展激光及光电测试技术研究以来,研究室依托精密测试技术及仪器国家重点实验室,以汽车制造、航空航天制造与检测、
本文主要采用了专家访谈法、问卷调查法、数理统计法和逻辑分析法对福州市高校篮球俱乐部的开展现状进行了较全面深入的调查研究与分析。探讨影响福州市高校篮球俱乐部发展的
多标签学习问题广泛存在于文本分类、图像标注、信息检索、基因功能分析、医学诊断、定向营销以及电子商务中的个性化推荐等很多现实的应用中,近年来得到了大量的关注和研究