基于多视角数据的迁移谱聚类学习

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lizheng124128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中,真实数据往往来自多个异构源或者通过几个不同的特征集来描述,这便是多视角数据。由于多视角数据往往可以更为准确地描述目标对象,多视角学习已成为机器学习领域的重要分支之一。与此同时,多视角数据往往会由于一些不可控因素丢失一部分样本,从而造成数据的不完整性。为了更好地处理这些不完整的多视角数据,不完全多视角聚类成为独立于完全多视角聚类的一大分支。挖掘(不)完全多视角数据潜在的一致性信息是提升(不)完全多视角聚类性能的关键。为了更好地从完全多视角数据中学习一致性,本文借鉴嵌入迁移的思想,提出基于双嵌入迁移的多视角谱聚类(DETMSC)。在DETMSC的基础上,提出基于正交基的多视角迁移谱聚类算法(OMTSC),OMTSC可利用正交基聚类发现潜在的聚类中心。同时,提出基于双嵌入迁移的不完全多视角谱聚类(DETIMSC),实现嵌入迁移和嵌入学习,以此有效挖掘不完全多视角数据的一致性。1)与现有的许多算法相比,DETMSC可以在一个统一的框架中同时学习一致性嵌入和特征嵌入。这是由于通过二部图协同聚类实现了多视角间一致性嵌入和特征嵌入之间的知识迁移。通过这种方式,DETMSC可以同时考虑多个视角的一致性和每个视角特征嵌入的多样性。利用特征嵌入的多样性,可以实现最优一致性嵌入,从而提高多视角聚类的性能。更好的一致性嵌入可以反过来帮助学习特征嵌入的多样性。由于对特征嵌入施加了稀疏约束,DETMSC方法对每个视角中的噪声也具有鲁棒性。在四个真实数据集上的实验结果表明,DETMSC模型的性能优于其他先进的完全多视角聚类算法。2)OMTSC沿用DETMSC的思想,并将每个视角的聚类分配矩阵分解为共享正交基矩阵和特定视角聚类编码矩阵。与DETMSC不同的是,一方面,正交基矩阵可捕获并储存多视角一致性信息,形成潜在聚类中心;另一方面,经过加权融合的多视角聚类编码矩阵可更好地平衡不同视角的质量差异。在三个真实数据集上的实验结果表明,OMTSC模型优于其他先进的完全多视角聚类算法。3)DETIMSC解决了现有不完全多视角聚类算法的不足:(1)仅适用于双视角不完全数据,更不适用于任意缺失多视角的不完整情况;(2)无论从理论上还是从实验上,基于缺失信息恢复的算法都无法保证恢复的视角的合理性;(3)无法很好地消除不完全多视角数据中的噪声干扰。DETIMSC继承了DETMSC关于嵌入迁移的思想,同时进行有效的嵌入表示学习。具体来说,嵌入表示学习旨在探索每个单一视角在低维空间中的局部信息和所有视角共享的语义一致性信息,通过协同正则化约束,最小化个体样本嵌入与一致性嵌入之间的差异,以获得更为准确的多视角一致性嵌入表示。在五个真实数据集上的实验结果表明,DETIMSC模型的性能优于其他先进的不完全多视角聚类算法。
其他文献
人脸年龄评估是预测图像中人脸的年龄信息,是一种极具发展潜力的生物特征识别技术,对建设智慧与安全城市具有重大的意义,在人机交互、视频监控和市场分析等领域都得到了广泛的应用。随着深度学习技术的发展,越来越多的研究人员将深度学习技术应用于人脸年龄评估。然而,多数基于深度学习的模型直接从人脸样本中学习单一的年龄特征用于年龄评估,导致学习到的年龄特征鲁棒性不强、易受性别、种族、环境、光照和姿势变化影响。此外
学位
随着工业4.0标准的推进和深度学习、大数据等技术的发展,机器人正逐步走向智能化。机器人在现实生活中的应用十分广泛,除了在工业应用中帮助人类更高效地完成工作以外,还可以在日常生活中代替人类完成各种工作任务。而机器人能像人一样完成各种复杂的工作,依靠的不仅仅是外部的硬件设备,更重要的是机器人的决策系统,机器人的自主决策能力和策略迭代优化是实现智能机器人决策系统的关键。目前智能机器人的应用领域涉及军事、
学位
在人类社会的发展过程中,距离测量一直都有着极其重要的作用,其测量的精度也成为当今航空航天技术、装备加工制造、精密测量等领域的重要指标。随着科学技术的发展以及科学研究的不断深入,人们也一直在追求更高的绝对测距精度。传统的激光测距已经难以满足当前工业场景中的大尺寸、高精度、实时性测量要求,飞秒激光频率梳的出现,为解决这一问题提供了技术方法。飞秒锁模激光器发射出超短脉冲信号的脉冲宽度在飞秒量级,具有较高
学位
推荐系统是用来解决信息过载的一项重要技术,然而,传统的推荐模型中存在数据稀疏性和冷启动的问题,从而导致推荐精度不高。研究表明,一般的解决方案是通过添加一些额外的语义信息来提高推荐的准确性。而知识图谱包含了大量的语义内容,可以作为推荐系统的辅助信息。图卷积神经网络可以很好的处理非欧几里得结构,即图结构数据。将知识图谱和图卷积神经网络结合,利用图卷积神经网络来挖掘出知识图谱中节点之间的特征。另外,用户
学位
借助热红外线对微弱热源的观测能力,开展大范围非接触式异常热源观测技术的研究对公共安全领域具有重要的意义。在热源观测领域中热红外图像是微弱异常热源的重要信息载体。受限于器件性能与复杂环境干扰,热红外图像存在分辨率低、对比度差、噪声干扰与纹理模糊等问题。相应的,热红外图像承载的微弱异常热源存在像素信息少、易被噪声干扰与纹理细节不足的问题。图像超分辨率算法通过构建低分辨率图像与高分辨率图像之间的空间映射
学位
复杂网络任意两点之间的最短路径计算方法不仅应用于信息通信、交通运输、灾害预警等众多实际应用场景,也是复杂网络特征量计算的依据。因此最短路径问题得到了众多领域学者的关注。随着大数据时代的来临,网络规模已远超出最短路径经典算法的适用范围,近似算法成为了可行的替代解决方案。然而现有的近似算法在效率上的提升都是以牺牲大量的预处理或搜索精度为代价的,无法同时满足大规模网络最短路径计算的高准确度和低延迟的需求
学位
近年来,学者们为突破冯·诺依曼计算系统的局限性和实现更强的计算系统,且在生物脑科学的启发和在硬件算力快速发展的背景下,提出了诸多关于类生物神经网络的计算技术,而在对生物神经网络的模拟中,脉冲神经网络(Spiking Neural Network,SNN)是目前较多学者研究的类脑计算技术。脉冲神经网络的神经元节点具备时间序列动力学特性,其突触结构通过稳态可塑性学习规则来达到平衡,并且能通过不同的拓扑
学位
信息抽取技术作为自然语言处理领域最重要的底层任务,旨在从非结构化的文本中抽取出高密度的知识元,其最重要的两个子任务是实体识别和关系抽取。知识图谱具有强大的语义推理能力,构建高质量的产业知识图谱能够推动行业信息化转型。然而,互联网上的非结构化数据通常蕴含着复杂的文本结构,传统的信息抽取算法无法应对这种复杂的语义信息。本文通过改进现有的算法,围绕如何有效处理重叠三元组这一问题展开研究,主要研究内容如下
学位
过去的几年里,随着图形图像处理设备性能的大幅提高,深度学习席卷了计算机视觉大部分领域。目前为止,SFM(Structure From Motion)是计算机视觉中少数还是由传统方法占据优势的领域之一。传统的SFM算法大多依赖于几何计算,首先通过特征匹配找到两帧之间的相匹配的特征点,再利用几何线索的显式推理来重建三维结构,从而得到深度信息。这些算法经过多年的研究和优化已经取得了优秀的成果,但是在环境
学位
透明物体作为日常生活中常见的物体,对其进行操作是机器人领域中具有挑战性且亟待解决的问题。其中,如何实现透明物体的6D位姿估计已成为一个关键技术难点。目前,主流的6D位姿估计方法主要面向于纹理丰富或不透明的物体。本文将以透明物体作为研究对象,结合透明的光学特殊性,开展了对透明物体基于RGB-D的6D位姿估计方法研究,提出了纹理与深度信息融合的透明物体6D位姿估计方法。本文的研究内容主要包括:(1)针
学位