基于深度学习和迁移学习的跨模态检索研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:mldn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,大量的多媒体数据充斥在人们的数字化生活中。作为一种新兴的高效信息检索方法,跨模态检索可满足人们对多模态信息检索的迫切需求,成为当下研究的热点。如何挖掘多模态数据的语义信息,充分利用不同模态间隐含的语义关系是跨模态研究的重点与难点。目前跨模态检索研究一般采用海量样本标注的多模态数据集。而在车载视频、监控视频、遥感影像等行业应用中,往往会产生大量无标注数据,并存在模态缺失、数据质量低、标注成本高导致的可用样本数量少等问题。这样的数据可定义为小样本多模态数据,其特点是可用数据少,一种模态数据远少于另一种模态。使用小样本多模态数据训练模型困难,造成跨模态检索精度较低,在此定义为小样本跨模态检索问题。为解决该问题,本文基于深度学习与迁移学习对跨模态检索进行了深入研究,主要工作如下:(1)提出了一种基于深度学习的跨模态任务学习框架,构建了端到端的跨模态检索与识别网络(CMR2Net)。CMR2Net使用相似性度量的方式对特征进行融合,分析语义关系实现异构数据高层特征的关联,解决了不同模态之间语义计算的问题。为验证CMR2Net的跨模态检索效果,实验采用样本交叉配对的组织方式,构建了特种车辆多模态数据集(SVMD)。在SVMD上进行的图像-音频跨模态检索实验表明,CMR2Net可达到较高的检索精度,能有效地学习到不同模态间的语义相关性。(2)提出了一种基于迁移学习的遥感图像跨模态检索方法。为解决小样本数据跨模态检索问题,进一步构建了基于迁移学习的跨模态检索与识别网络(TCMR2Net)。TCMR2Net迁移了CMR2Net的模型结构与低层参数。为验证TCMR2Net的跨模态检索效果,实验使用高分二号卫星的可见光和近红外遥感图像,构建了遥感多模态飞机数据集(RSAMD)。在RSAMD上进行的可见光-近红外跨模态检索实验表明,TCMR2Net能有效地迁移不同领域的低层知识,与未使用知识迁移的模型对比具有较高的性能提升。本文采用深度学习与迁移学习方法,挖掘多模态数据之间潜在的语义关联,在小样本数据集中可实现较高精度的跨模态检索,能有效节省数据预处理的成本。本研究对解决小样本跨模态检索和跨模态目标识别等科学问题,具有一定的理论指导意义。相关算法对无人驾驶车的特种车识别、遥感图像跨模态目标检测及遥感智能信息提取等应用系统的研发,具有一定的参考价值。
其他文献
<正>科学的发展观对德育有无指导意义,德育要不要坚持科学发展这一原则,答案显然是肯定的。德育作为教育的组成部分,作为全面建设小康社会的重要方面,必须坚持科学的发展观。
会议
本文分析了施工图预算软件的功能要求,探讨了施工图预算软件设计方法,详细地阐述了定额库数据文件设计,提出采用主元与辅元链接直接存取的文件组织方式,即保证数据调用速度快又保
本文主要介绍了如何快速测定不同种类粉煤灰的化学成分,研究认为,采用氟硅酸钾容量法测定粉煤灰中二氧化硅含量的准确度与重量法相当,该法既快速方便,药品消耗又少,并指出了在不分
1927年10月,浙江湖州五洲书局出版了一部“言文对照”本的《文心雕龙》,该书以黄叔琳注、纪昀评本为基础,对《文心雕龙》五十篇作了“白话演述”,亦即语体翻译,演述者为冯葭
本文采用分光光度法测定番茄中的维生素C含量,此方法原理为:利用维生素C的还原性,将Fe3+转化为Fe2+,Fe2+可以与K3[Fe(CN)6]反应生成可溶性普鲁士蓝。通过测定普鲁士蓝在750 nm
内关乃心包经之络穴,与三焦经相络,又是八脉交会穴之一,通阴维脉。一穴贯连三经,故内关穴有较高的临床应用和实验研究价值。通过整理古代文献关于内关穴的论述,试图从穴位文
<正> 人类对汞的认识始于公元前二、三世纪以前,中国人和印度人都被认为是认识汞最早的民族。其实,其他民族在很早以前也有一定认识.经日本堀口博先生的考证,在波尼亚、迦太
<正>近期,随着"小鲜肉"被荧幕和粉丝热捧,且渐呈大众审美新趋势,也成了舆论的焦点,有追捧也有批评,但毋庸置疑的是"小鲜肉"确实创造了叹为观止的庞大粉丝经济效应。而在产业
社交媒体时代下放的话语权所带来的不仅仅是崛起的草根文化,更带来解构主义的崛起——当下我们所处的文化现状的普遍形态便是反抗权威价值观。作为解构主义其中的一个重要部
<正>腰椎间盘突出症(以下简称腰突症)是指因椎间盘变性后纤维环破裂和髓核组织突出,刺激、压迫神经根或马尾神经而引起的综合征[1],可分为气滞血瘀型、肝肾亏虚型和风寒湿型,其