基于鲁棒非负矩阵分解的聚类算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:modlong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新型冠状病毒肺炎疫情在全球爆发,面对海量的出行轨迹、资源分配和疫情防控等数据,如何从中挖掘出有用的信息对疫情进行联防联控显得十分重要。聚类作为数据处理的基本工具在我国精准施策过程发挥了十分积极的作用。由于非负矩阵的可解释性,非负矩阵分解已成为基于局部表示整体的重要表达形式。它已成为用于聚类任务的数据分析工具。非负矩阵分解(NMF)是用于聚类任务的经典数据分析工具并且通常NMF考虑平方损失来衡量重构误,因此它对异常值的存在很敏感。为了解决这个问题,本文对NMF的鲁棒性进行研究,并提出了两种鲁棒NMF模型:1、本文重新考虑了双曲正切(tanh)函数作为鲁棒损失来衡量重构误差,提出了基于参数化双曲正切函数的NMF模型(tanh NMF)。2、为了考虑相似性重构的鲁棒问题,本文探索了一种鲁棒的基于相似度的概念分解模型(Robust Similarity based Concept Factorization,RSCF)。本文主要工作为:1)为了抑止离群值对损失函数的影响,提高模型的鲁棒性,本文提出了一个基于参数化双曲正切损失函数的NMF模型,称为tanh NMF。并且本文为tanh NMF设计了一个新的局部约束项,提高感知数据局部结构能力。在有/无损坏的四个常用人脸数据集上进行聚类的实验表明,该方法在与包括NMF及其鲁棒基准方法比较中,均取得了令人满意的性能。2)本文还提出了一个概念分解的改进模型,即基于相似性的概念分解(Similarity based CF,SCF)。SCF在重建相似性的同时也考虑了对数据进行重构,这提高了聚类的性能。同样考虑到SCF目标函数的鲁棒性,本文使用无穷范数来衡量SCF的重建误差得到新的鲁棒SCF(RSCF)。因此,RSCF有相似性保留、对相似性扰动的鲁棒性以及重构样本的能力。本文中大量的实验验证了这两种方法的优点,并且与比较的基准算法相比,本文所提出的SCF和RSCF可以实现较大的性能提升。
其他文献
现代船舶通信以安全、高效、智能为目标,其发展趋势主要体现在:船岸通信一体化、船岸管理一体化、船舶监控智能化、应急处置自动化,确保通信更加顺畅,确保船舶航行更安全。面对高标准的管理、监控、安全要求,陆地各业务主管单位均实现了岸船管理一体化系统,陆地和海洋船舶通信迅速融为一体,但是由此导致了多个应用软件无序竞争有限的卫星通信带宽资源,容易造成信息传输速度慢、冗余大、效率低、稳定性差,无法满足业务主管单
语音、图像、文字等作为传承世界文明的载体,极大程度地丰富了世界文明发展史,一直是学术界与工业界研究的重点,随着数字化社会的不断发展,人们希望从这些载体中提取到更有用的信息,当这些信号以矩阵形式进行表示并进行运算时,可以解决生活中的实际问题。本文主要以语音分离为研究背景,针对语音分离过程中矩阵分解效果与效率问题进行研究。首先,由于分离场景的不确定、分离对象为多说话人混合语音信号,存在信号特征表达不充
为了丰富水下铁磁性目标探测手段,弥补声纳探测方式的不足,磁异常探测作为非声探测的主要方式受到了越来越多国家的重视。而超导量子干涉仪(SQUID)作为目前最为灵敏的磁传感器之一,能够将微小的磁场变化转化为可以测得的电压信号,可以将磁异常探测灵敏度成数量级的提升。低温直流超导量子干涉仪(DC-SQUID)是各类SQUID器件中的一种,具有噪声低、灵敏度高、结构稳定等特点,本文基于DC-SQUID器件,
磁浮列车依靠电磁力实现与轨道无接触运行,是一种新型轨道交通系统,其中悬浮系统是支撑磁浮车辆的核心关键系统。悬浮系统故障不仅包含了各个部件的完全失效,也包括了由于长时间运行导致性能退化产生的微小故障,不论是哪种故障的发生,都有可能影响磁浮列车正常运行,因此对磁浮列车悬浮系统的故障诊断问题进行研究十分必要。在国家“十三五”重点研发计划课题任务“永磁电磁混合悬浮系统建模、故障诊断与容错控制研究”支持下,
本文以某巡航导弹的毁伤为研究内容,主要使用仿真计算等方法对破片战斗部毁伤巡航导弹进行了研究,以实现对破片战斗部打击巡航导弹目标的毁伤效能评估。首先,对巡航导弹目标进行了系统地调研,分析了目标的结构、材料、战场作用以及毁伤模式等,建立了目标的毁伤树,拟定了目标的毁伤判定依据,得到了目标各个舱段的等效靶模型;其次,对破片侵彻巡航导弹各个舱段进行了数值模拟研究,对巡航导弹不同舱段遭到毁伤的机理和现象进行
我国国内疫情的反复致使我们与新冠肺炎疫情进入了拉锯战中,可以说我们进入了后疫情时代,疫情的出现导致商业实体经济受挫严重,本文以后疫情时代下郑州商业实体经济的发展为题展开分析:通过对疫情前后郑州商业实体经济情况进行阐述,分析郑州商业实体经济发展的困境原因:第一,电子商务高速发展对于商业实体经济的冲击;第二,郑州商业实体经济配套设施不完善、专业人才不多;第三,郑州商业实体经济品牌建设力度不足、推广效果
随着深度学习的成功应用,计算机视觉领域也有了飞跃性发展。超分辨率技术(Super Resolution,SR)是计算机视觉领域下的一个分支,目标是能够从一张或多张低分辨率图像重构出高分辨率图像,使图像纹理更加清晰、视觉效果更加自然并符合人的视觉感受。目前超分辨率技术已被成功地应用于交通监测、卫星遥感、图像识别与目标跟踪等诸多领域中。本文在基于生成对抗网络的模型上进行改进,设计了一个能将图像分类训练
军用车辆作为战斗人员与武器装备的运输工具,在现代战场中发挥着重要的作用。由于面临的特殊战场环境,机动性能是保证军用车辆发挥运输作用、完成作战目的及提高生存能力的重要前提。随着战场的转移与战争形式的变化,军用车辆在松软路面的行驶特性研究显得尤为重要。在机动过程中,军用车辆的战场机动性主要由车辆与地面的相互作用决定,因此目前的研究重点是轮-壤相互作用。本文结合军用车辆的研究背景,针对现有理论未考虑车辆
海上搜救应急处置能力是海上生命与财产安全的重要保障,同时也是建设“海洋”强国的重要工作内容,开展海上搜救应急处置资源方案生成方法的研究有助于提高我们国家的海上搜救应急处置能力,同时对提高中国的海洋“软实力”也具有积极作用。目前,我国海上搜救应急处置过程中存在搜救效率较低,搜救决策科学性不足以及搜救资源不能合理利用等问题,针对上述问题,本文对海上搜救资源方案生成问题进行了研究,设计了基于“初始优化+