基于演化计算的自适应数据聚类方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:pipiskin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,现实生活中会有大量的数据产生和积累,这也促使人们不断去挖掘数据背后的信息和价值。聚类分析的结果能了解到数据本身的分布信息和对应的结构,从而更好地帮助人们解决实际应用中的问题。而在许多实际的应用中,执行未知聚类数目的自动数据聚类分析是很有必要的。演化计算在处理这类任务方面有其显著的优势,但现有的演化聚类算法仍然存在一些问题。本文提出了一个全新的弹性差分演化算法(Elastic Differential Evolution,E-DE)解决自动数据聚类问题。不同于传统的演化计算方法,算法采用的是可变长度的编码方案,该方案只编码在聚类过程中生效的中心坐标,消除了编码的冗余性,从而提高算法的搜索效率。为了让种群中不同长度的个体向量可以交换学习到正确的信息,我们设计了一个两阶段的变异算子和一个基于子空间的交叉算子。变异方法首先是通过不同个体的差分信息确定聚类数目,进而通过高斯扰动确定聚类中心坐标。而交叉方法则是利用一个选定的染色体片段构建出的子空间区域交换目标向量和变异向量中的聚类信息,通过子空间交换的方式产生新的试验变量。这些演化算子以传统的差分演化算法作为基础参考,再结合聚类空间结构上的信息,产生对应的后代解决方案。特别地,个体参数向量的每一维度都是和它相关的维度交换信息,这不仅使得算法能自适应调节类数,还避免了传统演化聚类算法存在的维间学习错误的问题。我们在现实和仿真数据集下的实验结果表明,本文提出的算法性能优于现有的聚类算法。算法不仅能找到正确的聚类数目,还可以取得一个好的聚类指标适应值。通过后续的灵敏度分析,检验本文的参数设置、演化算子的设计和空类的处理,再一次证明了本文提出的算法的有效性和鲁棒性。
其他文献
糖尿病等疾病在临床上有监测与评估微循环功能的需要。为了克服常见的基于多普勒效应、干涉等原理的测量手段在跨样本对比上的先天不足,许多研究者从热分析的角度提出了不同
数据爆发式增长为存储行业带来了机遇与挑战,如何保证存储系统中数据的可靠性成为亟待解决的问题。基于纠删码的编码技术在保证存储系统数据可靠性的同时,因能有效地减少存储系统的存储开销而广泛地应用在存储系统中。基于纠删码的编码技术主要研究方向有:提高编解码效率,降低存储开销以及减少解码所需数据量。论文以提高编解码效率,降低存储开销,减少解码所需数据量为主要目标,从使用移位和异或操作进行编码且使用Zigza
LDPC(Low-density Parity-Check)码的编译码复杂度较低,目前正广泛的应用于当前的通信系统中,如第四代(4G)通信系统、光纤通信系统等。Polar码是可以证实达到香农极限的编码方案,
随着人工智能和物联网技术的迅速发展,人体活动识别成为了人机交互领域的重要研究方向。其中,基于商用Wi-Fi的人体活动识别技术部署代价低且不需要人体携带设备,因此具有广泛
清末诗坛涌现了许多优秀诗人,欧阳述就是其中一位。欧阳述身处封建乱世,其曲折的人生经历、广泛的诗友交游以及渊博的学识,使得他的诗歌创作达到了很高的艺术成就。他论诗不囿门户,不偏一代,不主一家,主张转益多师。本文重点以《浩山诗集》中所收录的九百余首诗歌为研究对象,从欧阳述的生平经历与诗歌创作入手,将其诗歌进行整理分类,探究其诗学渊源与诗歌艺术特色,从而客观评价欧阳述诗歌在江西诗坛乃至近代诗坛的地位与意
近年来,卷积神经网络的快速发展使得较传统算法有更高的精确度,因此也被广泛应用于多个领域。然而在不断追求更好的精度表现过程中,算法的复杂性与算法模型大小也不断增加,算
近年来,在线数据量呈指数级增长,这些数据的主要部分与基于互联网的电子商务平台和社交平台有关。对于个人或组织来说,想要从巨量的数据中及时提取想要的信息是十分困难的。
随着我们国家经济的不断发展,社会竞争日趋激烈,并驱争先,劳动力的供给跟不上社会的需求,社会需要大量人才的填充,而当这些人才在用人单位创造利益的时候,也面临着一些看不见的潜在的危险,比如工作环境的恶化、繁重的工作任务、巨大的工作压力等等,这些潜在的危险最直观的表现就是反映在劳动者的身体上,可能会带来众多的身体疾病,比如工作中可能会接触有毒有害物质而引起的疾病、因过度劳累所导致的高血压、心肌梗塞等疾病
无线传感器网络(Wireless Sensor Network,WSN)是近二十多年来研究最为热门的技术之一。其自身优势的特点是,与其他技术相比,无线传感器网络可以长时间自主地执行监控任务,且
目标跟踪技术作为计算机视觉领域的研究热点之一,在视频监控,智能驾驶以及人机交互等领域有着广泛的应用。尽管国内外专家学者提出了各种各样的算法,但由于目标跟踪技术应用