多源深度迁移学习研究 ——以小样本高光谱图像的分类为例

来源 :天津大学 | 被引量 : 0次 | 上传用户:out000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习凭借其特有的优势,在计算机视觉等多个领域被广泛关注。本文概述了机器学习、深度学习及其相关算法,分析了经典的神经网络模型,并且详细介绍了常见特征提取算法和数据处理技术。本文建立了一种多源深度迁移学习分类模型MS-DTL,该模型在对深度学习算法创新的基础上,充分发挥了迁移学习的优势。为在源域中实现多任务学习的目标,模型MS-DTL采用多源训练策略,通过增加训练数据多样性,来提高预训练模型的特征提取能力。此外,在源域中设计了一个针对不同数据集的复合损失函数,用于误差反向传播。模型采用基于全卷积网络的深度结构,打破了迁移模型对源域和目标域中数据尺寸一致性的限制。高光谱图像光谱信息丰富,但由于图像本身标注样本不足,当对其进行分类时,尤其是使用深度网络模型时,常会出现梯度爆炸或消失以及过拟合等一系列问题。小样本的高光谱数据集与其他样本量较大的数据集相比,在分类任务中的劣势就更加明显,标注样本稀缺的问题也更为严重。实验结果表明,本文模型MS-DTL在小样本高光谱数据集的分类任务中,得益于深度学习网络结构的优势,在极大节约训练时间的前提下,与其他优秀的分类算法对比得到了有竞争力的分类精度,从而进一步验证了本文多源深度迁移学习算法的有效性。
其他文献
近几年深度学习的蓬勃发展,基于深度学习的许多课题成为热点研究对象,模态识别问题作为其中热门课题之一,旨在通过单个或多个模态序列进行分类,进而学习不同模态对应的内容,最后输出为文本内容。这其中主要模态是听觉和视觉,目前双模态识别(听觉和视觉)由于数据集不够丰富、语言的多样性以及说话人习惯等限制仍处于发展状态。本文从模式识别的数学定义出发,将提出的问题进行数学建模,构建了双模态视听的架构,提出了一种新
当今时代存在着海量的以结构化或者半结构化形式存在的文本信息,隐藏着巨大的价值。因此,从海量的文本信息中提取有价值知识是一项十分重要的任务。信息抽取任务就是以此为目标而诞生的。论文研究信息抽取子任务之一的关系抽取任务。关系抽取,旨在从文本中自动检测和识别出实体之间具有的某种语义关系,是知识图谱构建和信息抽取中的一个关键环节,具有重要的理论意义和广阔的应用前景。论文的主要工作如下:1.将门控图神经网络
数十年来,不管是在心理学界还是模式识别界,人们都对面部表情进行了广泛的研究。目前更具挑战性的微表情识别研究也在兴起。微表情是指在人脸面部表现出微妙情感,它是一种快速而微弱的面部运动,人类几乎无法控制。尽管近年来人们对面部微表情的研究有了很大的进展,但在微表情识别方面仍有很大的改进空间。微表情分析在情感监控、犯罪侦查、心理治疗等许多领域都有应用。与传统表情识别相比,识别微表情更具有挑战性,因为微表情
气敏传感器能对易燃易爆、有毒有害气体等进行检测,在当今的生活和生产中有着广泛的应用。气敏传感器的性能主要由气敏材料决定,金属氧化物半导体材料具有良好的光电性能,并具有制备工艺简单、绿色环保等特点,目前已成为气敏传感材料领域研究的热点。ZnSnO3是一种三元金属氧化物半导体材料,不仅具有气敏性能,还具有UV光电性能。但ZnSnO3作为气敏材料,具有工作温度高的缺点,需在200℃以上才能表现出良好的气
随着多媒体和显示技术的发展,3D视频技术逐渐成为视频领域的研究热点。作为最常用的3D视频格式之一,多视点视频加深度(Multi-view Video plus Depth,MVD)格式通过增加深度视频和视点数量等方式为观众提供沉浸式视觉体验。如何在码率受限的条件下对深度视频进行高效编码,成为MVD视频需要解决的关键问题之一。深度视频的内容特性与彩色视频存在较大差异,针对彩色视频提出的方法在深度视频
关系抽取技术作为国内外自然语言处理和知识图谱系统构建工作过程中的一个重要环节,具有重要的理论意义和广阔的应用发展前景。近年来,随着互联网计算力的快速发展和数据资源量的飞速膨胀,自然语言处理的各个发展方向都开始受到了极大的重视和推动,对于自然语言处理中关系抽取的精确性和灵活性也渐渐有了更高的技术要求。目前主流的关系分类抽取的方法研究中,传统的基于统计学的机器学习方法,存在着诸如误差在模型中不断传播、
DNA结合蛋白在细胞生命活动中起着至关重要的作用,仅根据蛋白质序列信息完成DNA结合蛋白的鉴定和功能注释是目前生物信息学研究中的主要挑战之一。传统的机器学习方法只能预测较小规模的数据,基于深度学习的预测方法虽然在大数据集上取得了显著的预测结果,但是并不能找出DNA结合蛋白的功能域。在本文中,提出了一种基于自注意力机制的深度学习模型能够完成DNA结合蛋白的鉴定和功能注释。一条蛋白质序列经过编码层、嵌
助听器是医学界广泛认可的听障患者听力干预和康复的有效手段之一。目前助听器的听力改善效果并不理想,其中一个主要原因是置身于复杂多样的声音环境通常会使得助听器的性能出现很大的偏差,为了解决此问题需要对音频环境进行可靠的检测,为助听器根据不同场景进行自动切换提供环境信息。基于此本文提出了一种用于数字助听器的自动声场景分类算法。本文对目前使用的特征提取方法和特征分类方法进行了研究,提出了一种由基于全相位滤
随着自动驾驶、军事等领域对高速、高精度传感器需求的进一步提高,传统逐帧扫描图像传感器时间误差大、数据冗余等一系列缺点逐渐暴露出来。随后人们提出仿生图像传感器的概念,并且脉冲型仿生图像传感器与传统逐帧扫描图像传感器相比,具有冗余数据少、时间精度高和功耗低等优势,可应用于动态检测和高速目标追踪等领域。然而,随着传感器阵列增大和场景复杂度提升,脉冲型仿生图像传感器的输出时间误差和光强量化误差开始增大,并
随着CMOS图像传感器(CMOS Image Sensor,CIS)技术的不断发展,CIS如今已被广泛应用于各种成像领域。但典型的滚筒快门CIS在拍摄高速运动的物体时存在固有的图像失真问题,而这种问题在全局快门CIS中得到了很好的解决。因此,全局快门CIS在机器视觉、工业测量等领域具有极其重要的应用价值。但随着全局快门CIS中像素阵列的不断扩大,其设计复杂度也逐渐增加,从而导致了一系列非理想效应。