基于深度神经网络的聚类算法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:sccd920141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类作为机器学习领域中最基本的无监督学习问题之一,其主要目标是将数据中类似数据点聚成同一集群。由于数据原始空间中含有各种冗余、复杂的结构,通常对一般数据进行聚类时,聚类算法很难从数据中分离出不同的簇,因此聚类效果并不明显。深度学习能够从复杂数据结构中自动提取抽象的、非线性的以及更有利于聚类的特征,从而提高算法性能,近些年来在各种应用领域大展身手。本文依赖深度神经网络的特征学习来补充聚类算法,以便捕获数据本身或其内部结构从而去更好的分离集群。首先,研究了深度神经网络、堆叠自动编码器和聚类分析的相关理论,分析比较了稀疏自动编码器、降噪自动编码器以及收缩自动编码器之间的区别,介绍了本文所研究的自组织映射网络和高斯混合模型两种聚类算法。其次,提出基于自组织映射网络的深度聚类算法,它采用堆叠自动编码器对原始数据进行特征学习,随后用自组织映射网络对特征数据进行无监督学习,使得特征空间的数据被聚类成不同数据簇并达到最大可分离。通过实验分析了降维模型中各参数对数据聚类准确率的影响,对比了降维前后图片数据的差异,比较了特征提取阶段中相关参数对数据聚类准确率的影响和不同算法之间聚类准确率的差异。最后,提出基于高斯混合模型的深度聚类算法,它结合堆叠自动编码器和高斯混合模型两种模型,对数据降维后的特征使用期望最大化算法来训练高斯混合模型并更新数据簇,使数据在特征空间中实现聚类。针对所提出的算法通过实验进行评估,分析了算法在不同数据集上的性能表现并比较了不同算法之间的聚类准确率的差异。通过实验的分析比较,所提出的深度聚类算法对高维和低维数据在聚类性能上有一定的提高,验证了所提出算法的有效性。通过特征学习的深度聚类算法表现出了更好的聚类效果,并在聚类过程中所花费的时间更少。
其他文献
为探索高功率高增益天线的实现途径,提出并设计了一种矩形径向线馈电螺旋阵.阐述了矩形径向线馈电螺旋阵的工作原理,对辐射单元、耦合探针和馈电系统进行了详细设计,进而得到一个
当归(干归)属多年生伞形科草本植物,以甘肃东南部、四川、云南生产居多,且以岷县生产的质量优且量大,当归根可入药,是传统中医学上最常用的一种中药药材,具有和血、补血之效,
目的了解济南市市中区12~14岁初中学生超重和肥胖的流行现状,为制定有效的干预措施提供科学依据。方法对济南市市中区24所中学12~14岁初中学生进行测量身高、体质量,计算体质
在改革进入深水区,国情、世情、党情都发生巨大变化的当下,各级干部面临的“四大危险”和“四大考验”比以往任何时期都更加严峻.习近平总书记提出的“全面从严治党的决心不
环形加筋挡墙破坏形式的研究目前还处于相对空白阶段。笔者通过2组离心模拟实验,对环形加筋挡墙的破坏形式和变形特征进行了研究,初步判定了环形加筋挡墙的破裂面形状与"0.3H
<正>3月16日,2019年国际篮联篮球世界杯抽签仪式在深圳举行。燕京啤酒作为国际篮球世界杯的顶级合作伙伴,受邀参与。这也是燕京品牌又一次国际舞台的展示。现场与球迷开展互
随着计算机、遥感和地理信息系统技术的不断发展,多源数据融合技术得到了新的突破。本文将化马湾金矿区不同时相、不同分辨率的遥感影像数据和物探(航磁和重力)、化探数据(金
目的:研究乙肝后肝硬化合并食管胃底静脉曲张患者的血型对其治疗效果及预后的影响。方法 :选取常州市武进人民医院消化科于2010年6月至2013年6月期间收治的103例乙肝后肝硬化
随着我国城镇化发展速度的加快,到如今关于城市内部的景观设计已经形成了很多具有不同特点的风格,在过去一段很长的时间里,社会的主流观念一直影响着城市建设中的景观设计,城
目的:探讨解郁疏肝通脉汤治疗冠心病不稳定型心绞痛PCI术后抑郁状态(肝郁气滞证)的临床疗效,并通过现代医学的方法对解郁疏肝通脉汤进行疗效评价,为临床治疗该病提供一种新方法和新思路。资料与方法:将纳入研究的79例冠心病不稳定型心绞痛PCI术后抑郁状态(肝郁气滞证)的患者随机分为治疗组38例,对照组41例。两组均常规采用阿司匹林肠溶片、氯吡格雷(波立维或泰嘉片)或替格瑞洛口服双抗治疗抑制血小板聚集,阿