多视角学习算法及其应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dragon121212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自大数据时代到来之后,其对各行各业产生了深远的影响。同时,大数据下数据的表现形式也越来越多样,比如描述一个网页,可以由网页上的图片、文本和超级链接进行表征。又例如,描述一张图片,可以通过各种不同的视觉描述子来进行表达。这种描述同一实体的不同特征表达,称之为多视角数据。不同视角数据可以是异质的多模态数据,如网页中的文本和图像,也可以是同质的不同特征描述子,如图像的SIFT和GIST特征。因为不同的视角描述语义相同的实体但同时存在视角差异,这使得多视角数据之间存在互补与一致两个基本特性,这也是多视角学习的基础。针对当下多视角学习中亟待解决的一些任务,本文提出了几种多视角数据分析方法,并将其应用于多视角聚类和跨视角检索任务中。本文研究的主要内容如下:  1、基于谱聚类的子空间分割方法可以得到数据的结构化表达,具有重要的应用价值,但是并不能处理多视角数据。为了挖掘多视角数据结构化表达之间的关系,提出了一种基于结构稀疏的多视角学习方法。该方法首先基于稀疏自表达模型学习多视角数据的稀疏表达,同时通过不同程度的结构约束方式来建模不同视角之间的相关关系。为进一步提升模型性能,将数据之间的一些先验信息加入到模型中去以辅助多视角数据结构化表达的学习。多视角聚类实验结果验证了该方法的有效性。  2、多视角统一子空间表达与视角依赖子空间表达的关系一直是多视角数据一致与互补特性挖掘的难点,为了缓解这一问题,提出了一种基于知识图谱的多视角学习方法。该方法将数据视角间和视角内的相似关系类比为知识图谱,并通过知识图谱的建模方式辅助进行多视角数据高层语义表达的学习。在建模多视角统一子空间表达与视角依赖子空间表达的关系时,张量操作矩阵被引入以充分挖掘视角间的互补与一致特性。多视角聚类实验结果证明该方法可以学到更好的统一子空间表达。  3、异质视角之间往往存在较大的语义鸿沟,使得多视角数据关系挖掘变得困难,为了减少语义鸿沟,提出了一种基于深度自动编码网络的多视角学习方法。该方法通过叠加若干限制玻尔兹曼机网络以进行不同视角(图像和文本)的较高层语义抽取,在减小异质视角语义鸿沟的同时,提出使用自编码网络进行不同视角的编码以进行多视角数据关系的挖掘。这里为了量化互补与一致两个基本特性,将不同视角的编码层切分为两个部分,使其分别对应共享的信息以及视角独有的信息。多视角聚类和跨视角检索任务证明了该模型的有效性。  4、先验信息作为多视角数据的已知高层语义信息,可以在一定程度上指导多视角学习的过程,为了探索先验信息对多视角学习的影响,提出了一种基于结构约束的半监督多视角学习方法。该方法在优化多视角数据语义类别矩阵的同时直接借助于先验信息提供的语义标注进行语义类别矩阵的指导学习。模型可以处理部分观测语义类别和观测链接两种先验知识。考虑到不同视角特征对不同语义类别作用的差别以及视角内不同特征判别性的差异,提出了视角选择与视角内特征选择策略。半监督多视角聚类实验结果验证了该方法的有效性。  5、现实多视角数据往往呈现出视角缺失的问题,造成传统多视角学习性能的退化,为了缓解这一问题,提出了一种基于回归模型的不完整多视角学习方法。该方法基于数据回归的方式进行语义类别矩阵的优化,同时,借助于该语义空间,建模了不完整多视角数据之间的相关关系。为处理高维且具有噪声的多视角数据,结构化特征选择策略被提出并加以利用,除此之外,在语义空间学习的同时,视角间以及视角内部的相似性关系得以保持以增强模型的学习能力。多视角聚类和跨视角检索任务证明了学习到的语义空间的有效性。
其他文献
广义系统理论自20世纪70年代提出以来,展现了较强的应用背景,因此对其理论的研究及应用吸引了国内外众多学者的关注,并逐渐发展成为当今最重要的控制理论分支之一。时滞是工程系
非线性科学是研究不同学科中非线性现象共性的一门前沿学科,是在以非线性为特征的各门分支学科基础上发展起来的综合性学科.非线性动力学行为的研究不仅具有重要的理论意义,还
常见的精神疾病,包括注意力缺陷多动障碍,自闭症,双向情感障碍,抑郁症和精神分裂症等,是高度可遗传的多基因疾病。有证据表明这五种疾病既有共同的又有特异性的遗传和神经机制。本
为实现巡航导弹对目标的精确打击,本文围绕空射巡航导弹的飞行控制系统、航迹规划、航迹跟踪、三维导引律和三维视景仿真等内容展开了一系列研究工作。   首先,研究了巡航
学位
水体富营养化与藻类水华是全球性的水环境恶化问题,给自然生态和人类生产生活都带来极大危害。因此,有必要结合水质监测技术建立预警预报体系。藻类水华暴发的前提是藻类种群浓
在计算机视觉领域,图像语义识别(Semantic Recognition)是一项重要的图像理解任务,它是指利用计算机对图像进行处理、分析和理解,其主要包括语义分类、语义检测及语义分割等任务
时滞广泛存在于各种动态系统中,通常是导致系统不稳定、降低系统性能的一个重要因素。在过去的几十年里,对时滞系统的研究取得了大量的成果,但仍有许多问题亟待解决。  本文利
本文的研究内容是围绕国家“863”重点项目子课题“废墟洞穴搜救机器人研制”和机器人学国家重点实验室开放课题“可变形机器人自适应路径规划方法研究”展开的。以灾难救援
学位
现代战争中,飞航导弹为了提高作战能力,对导弹控制系统的性能、各种元部件的稳定性要求越来越高。然而在导弹的飞行过程中执行器、传感器等容易发生各种故障,如执行器卡死、传感
文物是人类在其历史发展过程中遗留下来的遗物、遗迹。文物的保护管理和科学研究,对于人们认识自己的历史与创造力,揭示人类社会发展的客观规律,认识并促进当代和未来社会的发展