基于深度学习的图像描述生成方法研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:yuexianglian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机、平板电脑等数字设备的普及和存储技术的发展,日常生活中产生了许多图像,对于人来说理解这些图像是一件很简单的事情,但是对于机器来说,这些图像只是一些像素值,不带有任何意义,如何让机器来理解图像变得更加有价值。近些年来,随着目标检测和机器翻译的发展,图像描述生成任务取得了巨大的进展。图像描述生成通俗来讲可以将其看作为“看图说话”,该任务的模型输入为图片,输出为人类可以理解的自然语言。本文主要内容如下:首先,本文应用了近些年来取得巨大成功的注意力机制。注意力机制的核心思想是模仿人类的视觉注意,把该机制应用到图像描述中能使得模型在生成单词时自动筛选出对更关键的图像区域,提高生成句子的准确性。然后,基于局部特征的图像描述模型仅使用了图像局部特征,可能存在信息丢失,针对该问题,本文提出了一个全局特征和局部特征相结合的图像描述模型。该模型在编码器中利用预先训练好的卷积神经网络模型提取图像的全局特征和局部特征,并将这两种不同尺度的模型融合在一起,形成对图像编码的结果。然后由LSTM组成的自然语言模型进行解码,把提取到图像特征翻译为自然语言。该模型可以充分利用图像的两种不同尺度的图像特征,生成的自然语言更加准确。最后,全局特征和局部特征相结合的图像描述模型强制要求全局特征对每个单词的生成都有效,存在一定的不合理性,针对该问题,本文提出一种自适应注意力机制,并且把该机制应用到图像描述模型中,该模型同样采用了编码器-解码器架构。自适应注意力机制可以让模型生成图像描述时自动选择关注图像的局部特征还是关注图像的全局特征。本文模型在Microsoft COCO数据集上进行训练,评估。在BLEU,ROUGE-l和CIDEr等评价指标上,比较了局部特征的模型、结合全局特征和局部特征的模型和自适应注意力机制的模型的性能表现,实现结果证明,自适应注意力机制模型在上述评价指标上均得到最高分,结合全局特征和局部特征的模型得分次之,基于局部特征的模型得分最低。
其他文献
审计模式的变迁主要经历了账目基础审计模式、制度基础审计模式和风险导向审计模式三个阶段。本文首先简单回顾了审计模式发展的几个阶段,然后对我国当前的审计模式进行了介
<正> 今后几十年内,我国城市家庭是否会出现核心化趋势?有不少学者认为中国家庭已趋于核心化,并且今后也会象发达国家一样,随着社会的发展,家庭结构必然趋向核心化。对此,刘
土地利用优化配置是促进土地资源的节约和集约利用,实现土地利用可持续发展的重要手段,也是当前土地科学和土地资源管理工作面临的重要课题。如何制定既科学又具可操作性的土
本文以宿淮盐高速公路段上的一套独立高柱广告牌设施为研究对象,基于ANSYS分析软件建立了三维有限元模型,以此为基础对广告牌进行模态分析及地震响应时程分析,研究了不同方向
针对广义时变系统的鲁棒容错控制问题,基于矩阵不等式及建立Lyapunov方程的方法,首先,在系统出现执行器故障的情况下,分别给出了两种广义时变系统模型鲁棒镇定的充要条件.接
目的:观察瘿气灵对Graves病(GD)患者甲功、突眼病及甲状腺肿大的疗效。方法:收集初发未治的确诊为GD的患者112例,随机分成肝胃火旺、心肝气阴两虚治疗组和西药对照组,治疗各
2018年海南省中考作文命题在继承与创新上呈现出强大的生命力与无可比拟的优势。首先,与过去十多年的命题思路一脉相承,依然采用"二选一"命题形式,给予考生更大的选择空间;其
本文所讨论的WTO争端解决机制中的报复制度是WTO争端解决执行程序中所规定的救济方式中的其中一种,该制度被引入WTO的争端解决程序中是为了达到能够促使违反WTO规则或者义务
2018年9月中共中央、国务院下发了《关于全面实施预算绩效管理的意见》,对构建全方位预算绩效管理格局、完善全覆盖预算绩效管理体系、健全预算绩效管理制度、硬化预算绩效管
当代中国美学的客观论和主观论,是古典知识论(实在论和观念论)的典型形态,其理论困境惟有通过现象学才能获得解决。而明显居于理论思维优势的实践主体性美学,其对主客观论美