面向聚类分析的新型弹性网络算法研究

来源 :北京建筑大学 | 被引量 : 5次 | 上传用户:gzmanman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代里,人类需要在非常大量的信息中挖掘潜在信息,其中聚类分析是重要的手段之一。在数据挖掘领域中,聚类分析是很重要的一块内容。由于技术的发展,需要处理的数据的数量增长快速,维度相比从前也增加很多,数据的结构类型变得更加复杂多样,因此聚类分析技术的发展面临着严峻的考验。传统的聚类分析技术可以分为基于层次的、基于划分的、基于网格的、基于密度的、基于模型的等五种类型,经过长时间的发展,学者们又提出了基于熵的聚类、谱聚类、不确定聚类等技术。但大多聚类分析算法缺乏普适性,在处理具有复杂多样的数据结构的数据集时常出现陷入局部极小的问题。近年来,随着对神经网络技术研究的复兴,学者发现该技术对不确定性信息的处理能力强,具有非常强的鲁棒性,其中属于无监督学习的弹性网络算法具有良好的几何性质,可以针对一个具体的目标函数进行求解,与聚类问题的定义非常契合,因此本文在弹性网络算法的基础上进行了研究,将该网络应用在聚类分析领域中。本文的主要工作内容和成果如下:1、由于原始弹性网络算法仅用于求解TSP问题,因此首先提出基于极大熵的弹性网络聚类算法(Elastic Net of Clustering based on Maximum entropy,ENCM)。根据聚类的定义,更改弹性网络算法的目标函数,在没有先验知识的情况下,采用极大熵原理确定数据集的概率分布。在弹性网络框架下,模拟物理系统,利用确定性退火技术使系统升降温,控制网络活性,并利用最速下降法追踪最小值。2、在聚类分析算法中,数据集的数量与维度等特性对聚类过程的影响很大。针对聚类中出现的易受噪声干扰、多维等问题,提出具有加权特性的弹性网络聚类算法(Weighting of the Elastic Net for Clustering Algorithm,WENC)。根据聚类的目的,遵循当特征属性更离散时对聚类的意义更小的原则,计算数据集中各个维度在聚类过程中所占比例,即权值。分析弹性网络算法的特性,设计一种合适的加权方法,使网络在运行过程中,减少噪声的干扰,优化聚类质量。本文实验的数据集包括随机生成和从UCI数据库中选取两种,将提出的算法分别应用于这些数据中进行实验,并和其他较为典型的方法对比分析。实验表明两种算法均可以很好的求解聚类问题,且在运行时间和聚类质量上WENC算法比ENCM算法的好。WENC算法无需人工指导训练,可以自学习的求解出质量比较高的聚类方案。通过对不同维度、不同数量级的数据集,不管是随机产生的还是从数据库中选取的,都验证了算法的有效性和稳定性。相较于传统的算法,本文提出的方法显著的提高了聚类质量。
其他文献
现阶段,我国老龄化已经进入快速发展时期,并逐渐向高龄化推进。在这一过程中,由于老年、高龄疾病患者不断增多,导致相关机构对于社会医疗资源的需求总量不断扩大,因此需要创
词语搭配是传统语言学研究中的一项重要内容,在语料库语言学的研究范式中,词语搭配突破了靠研究者自省的只能定性而不能定量的不足。词语搭配的选择从表象上来说是词语之间的
2002年全区农业和农村经济工作的主要任务是:紧紧围绕结构调整和农民增收的中心任务和基本目标,以建设绿色无公害农产品基地、农区畜牧业基地、乡镇企业小区,发展区域经济为
2018年诺贝尔经济学奖得主保罗·罗默是内生增长理论的创立者,其重要贡献是研究引致技术创新的知识积累如何作为经济增长最恒久的驱动力,并催生了大量鼓励创新的法律和政策的
城乡统筹,"三化"互动,是加快我区农业和农村经济发展步伐的战略举措.推动"三化"进程,为农业和农村经济创造了新的发展机遇,也对做好新阶段农业和农村经济工作提出了更高更新
[摘要]介绍了美国密歇根州立大学ECE和CSE的9门课程教学中所采用的一些主要方法,通过对这些方法的分析,体会到美国大学本科教学“以学生为本,服务学生的学习和发展,造就卓越”的教育理念。美国大学的教育理念和教学方法,对我国高校本科教学改革和提高人才培养质量,具有重要的启示作用。  [关键词]美国大学;多样化;教学方法;启示  [中图分类号]G649.712 [文献标识码]A [文章编号]1005-
本文通过对8T8R多天线与2T2R多天线的容量分析、覆盖能力等方面进行仿真分析比较,论述了TD-LTE系统在各种场景下采用2/8天线的特殊优势。相信随着多天线技术发展以及在天线产
基于QuikSCAT海面风场产品,对海面风场资料进行了EOF分析和随机动态分析,以此分析南海海面风场的变化特征。研究发现:海面原始风场风速季节变化最为明显,其变化占总变化方差