基于深度学习的图像跨模态重建与识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lidongying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人类获取信息的重要来源。随着传感技术的迅猛发展,图像的形态呈现多元化,如应用在刑侦追捕等领域的法医画像;应用在放射医学等领域的核磁共振图像;应用在门禁系统等安全防范领域中的近红外图像;应用在生命探测等领域的热红外图像。来自不同传感器或不同成像环境下的图像(例如可见光条件下拍摄的人脸照片、画家手绘的素描画像、红外成像设备采集的近红外/热红外人脸图像、不同模态的医学核磁共振图像、计算机断层扫描图像/核磁共振图像)均称为不同模态下的图像,即跨模态图像。跨模态图像之间往往存在很大的差异,这对图像跨模态重建和识别带来了巨大的挑战。而现有的方法无法有效解决这些问题,满足实际的应用需求。因此,本文致力于图像跨模态重建与识别任务,以深度学习为理论框架,提出一系列跨模态图像重建与识别新方法。本文的主要创新性工作概括如下:1.提出一种基于深度信息融合的图像跨模态重建方法。现有的图像跨模态重建算法,大多受限于跨模态图像数据的规模,导致图像重建的效果欠佳,难以满足实际应用场景的需要。针对这一问题,提出一种基于深度信息融合的图像跨模态重建方法。首先利用不同的识别模型对图像重建网络分别进行监督,由于不同识别网络的差异,为重建结果带来了更大的类内多样性,然后将这些重建图像加入训练集,综合利用原始训练集与重建图像,进一步优化重建网络模型,最后实现更加清晰、真实的图像跨模态重建效果。2.提出一种基于身份信息保持的图像跨模态重建方法。现有的图像跨模态重建方法在图像重建的过程中,由于只考虑到生成图像与真实图像在像素级上的差异,而未考虑到特征级和语义级的差异,导致重建结果大多存在变形严重、细节模糊、语义判别信息较弱等问题,从而导致较差的主观表现和较低的定量评价分数。针对这一问题,提出一种基于身份信息保持的图像跨模态重建方法。首先,利用现有的跨模态人脸图像重建算法来扩充训练集。然后,采用跨域转换网络来增强图像重建模型在像素级、特征级、语义级的信息一致性,进而提高重建模型的生成效果,克服了跨模态图像之间的巨大差异,由于保持了多重信息一致性,使得转换前后图像的结构变形较小、细节保真度高。最后利用域内调整网络进一步优化重建图像的主观效果。3.提出一种基于自表示协同学习的图像跨模态重建方法。现有的跨模态图像重建方法只能从一种模态转换为另一种模态,无法有效利用多种模态的互补信息,导致有效信息的浪费,图像重建结果的准确性也较差。针对这一问题,提出了一个基于自表示协同学习的图像跨模态重建方法。本算法可以全面利用已有多模态图像中与目标模态相关的所有可用信息。与现有方法不同,提出使用自编码网络,作为自监督约束,计算针对缺失模态的自表示损失函数,对跨模态图像重建模型进行直接指导。最后可通过单一模型更加准确的生成任一缺失模态的图像。4.提出一种基于数据增广非对称联合学习的图像跨模态识别方法。现有的图像跨模态识别方法,无法根据小规模的跨模态图像数据进行有效学习,导致识别模型的精度较差。针对这一问题,提出一种基于数据增广的非对称联合学习方法。首先,利用已有的合成算法扩展原始训练集,由于不同方法的图像重建原理不同,重建图像的模态差异会为原始数据带来更多的判别信息。但是,将所有重建图像加入训练集的同时,也引入了冗余信息。所提出的非对称联合学习算法,可以在增加类内有效信息的同时,减少对类间差异信息的影响。最后,通过计算跨模态图像之间的对数似然比,获得其相似性。本方法在人脸素描画像数据集、法医画像数据集、近红外图像数据集、热红外图像数据集、低分辨人脸数据集和人脸遮挡数据集等多种人脸图像跨模态识别场景中均取得了很好的识别性能,具有较强的泛化能力。5.提出一种基于多间隔解相关学习的图像跨模态识别方法。现有的图像跨模态识别方法,由于没有考虑到图像之间的跨模态冗余信息,导致现有方法的识别精度较差。针对这一问题,提出一种基于多间隔解相关学习的图像跨模态识别算法,包括:跨模态图像的超球面空间嵌入和解相关学习。首先,采用大规模的可见光人脸数据集对跨模态表示网络进行预训练,以解决近红外-可见光人脸图像数据规模小的问题,并将图像映射到超球面表示空间;然后,在跨模态表示网络之后引入解相关层,对跨模态特征表示进行解相关学习,以减少跨模态图像之间的模态差异,并提出多间隔损失函数对网络进行优化,有效提升了近红外-可见光图像的跨模态识别精度。
其他文献
本文利用WRF中尺度数值模式,NCEP/NCAR再分析资料、多普勒雷达观测资料等,对2015年8月3日发生在山东地区附近的一次两种尺度低涡影响下的MCS过程进行数值模拟、潜热敏感性试验和对比分析,研究了此次过程中中尺度低涡发生发展的原因和两种尺度低涡背景下MCS中β尺度强对流带的演变成因及涡度结构。结果表明:(1)在天气尺度的东北冷涡槽前,高层高空急流入口区右侧存在强辐散场,低层有不稳定能量释放为
木芙蓉是中国传统名花,由于其花开深秋"拒霜"、花名寓意"福荣",雅俗共赏,自古以来深受国人喜爱。文章首先从生命、文化、美学、空间等方面总结木芙蓉的基本特征,基于历史文献
问题链是历史课堂教学的重要手段,对于高效课堂的构建具有十分重要意义。为了更好地适应学科核心素养的要求,课堂问题链的设置要具有强烈的目标意识,搭建层次分明而具有足够
P2P网贷平台经历了问题平台集中暴发时期后,目前已进入合规检查并整改备案时期,增加了投资者在网贷平台进行投资理财的信心。加之现在越来越多的网贷平台广告充斥着人们的眼球,吸引了众多投资者跃跃欲试。然而,P2P网贷平台的投资者必然面临着投资项目的选择问题。虽然现在大多P2P网贷平台会先对借款者进行审核,再将审核通过的网贷项目在平台进行发布,但借款人违约的情况仍无法完全避免。因此,如何指导投资者识别出信
生产作业进度管控是船厂生产管理的核心。随着“两化融合”等国家性战略的推进,船舶制造企业运用信息化手段进行船厂作业进度管理已成为提高企业生产管理水平的必经之路。在保证船舶作业的成本和质量的前提下,结合信息化手段对船厂作业进度进行有效的管理变得的十分重要。为了提高船厂作业进度管理水平,本文将网络计划技术和挣值法集成应用于船厂作业进度管控。主要的研究内容和成果如下:(1)船厂作业进度管理的相关概念剖析。
同时定位与建图(SLAM)是机器人进行自主运动的关键技术,具有广泛的应用前景。随着机器人技术的飞速发展,如何获得更为精确的机器人位姿显得尤为重要。由于深度相机能够获取更
多变量时间序列通常来自于对现实世界中的动态系统的监测,其中每个维度代表通过一个(虚拟)传感器测量出的局部特征。考虑到一组动态系统的相似性与差异性,并同时对它们进行准
随着网络信息技术的发展,全球已经迈入了多媒体大数据时代。数据信息通常关联图像、文本、视频、音频等多种模态形式,多种模态数据分别以不同的展现形式刻画同一事物,表达相
离子液体(Ionic Liquids,ILs)指完全由阴阳离子组成的,熔点在100℃以下的离子化合物。ILs具有独特的物理化学性质,包括良好的热稳定性、蒸气压低、液态范围宽、电化学窗口宽和良好的导电性等。质子化离子液体(Protic Ionic Liquids,PILs)和非质子化离子液体(Aprotic Ionic Liquids,AILs)是离子液体的两大分支。PILs结构中具有质子的给体和受
随着我国客运列车运行速度的不断提高和载客量的不断增大,车体结构的耐碰撞性能受到了广泛的关注,而在车体结构设计时采用合适的碰撞能量管理(CEM)策略是改善车体结构耐碰撞性能的主要措施。因此,为了进一步改进轨道车辆车体耐碰撞性能,本文基于美国AAR S-034和APTA SS-C标准要求,采用非线性有限元法,研究了某市域列车的CEM策略,提出了一种吸能过程有序可控的CEM系统,并对车体结构变形控制方法