基于多模态注意力机制的图像理解描述新方法

来源 :电子科技大学学报 | 被引量 : 9次 | 上传用户:chu74042828
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的图像理解描述方法存在描述句子不丰富、不准确、模型结构复杂、难以训练等问题,该文提出了一种端到端的基于多模态注意力机制(M-AT)的图像理解描述新方法。该方法首先通过关键词图像特征提取模型(K-IFE)提取更优的空间特征和关键词特征,并利用关键词注意力机制模型(K-AT)关注重要描述词语、空间注意机制模型(S-AT)关注图像更重要的区域并简化模型结构,且K-AT和S-AT两种注意力机制可以相互矫正,最终生成更加准确、丰富的图像描述语句。在MSCOCO数据集的实验结果表明该方法是有效的,部分评
其他文献
长期担任孟席斯内阁部长、后出任澳大利亚驻美大使的霍华德·比尔指出:“印度尼西亚是我们第一关注的国家。澳大利亚政府没有在公开场合更多谈论对这个新独立国家感兴趣的
从公元3世纪到16世纪上半叶,中菲间的民商和朝贡贸易得到了一定程度的发展。这种互惠贸易的发展与该时期中华文明的辐射和吸引力、政府外交政策的积极推动以及航海技术的进步
本文分析了准二级压缩的基本原理,以试验探究的方式对家用房间空调器采用喷气增焓技术进行了探研。通过对采用喷气增焓技术后的空调热泵系统的出风温度、低温制热能力、制冷
目的:保障患者用药安全,促进合理用药.方法:随机抽查2010年1~6月门急诊处方19662张,对其中不合理处方进行分类统计并分析.结果:不合理处方共421张,不合格率为2.14%.其中不规范处
宋代周紫芝所撰《竹坡诗话》论诗,包含了诗歌的基本创作原则、诗歌的创作技巧、作家作品论和文体论、诗人轶闻和创作轶事等方面。其中,“诗教”为核心的创作原则是周紫芝重要
近年来,我国的城市化进程有了很大进程,市政道路工程建设越来越多。在大型市政道路建设工程中,传统的施工承包模式已无法满足建设需求,需采用EPC总承包模式进行承建。在现阶
2005年,越南为仿效前苏联军队体制改革而废止23年的政委制重新得以恢复。这是越共中央为强化党对军队的领导、加强军队政治建设、适应军队现代化建设,不断提高人民军战斗力而
<正>农信社须高度重视案件防控治理,筑牢制度防线、责任防线、思想防线,让违规行为"不能做""不敢做""不想做"案件防控治理是一件长期而艰巨的任务。近年来,湖南省联社对案防
"21世纪海上丝绸之路"的构想以推动和实现从海洋为中心的全球化到海陆联通的全球化,从西方为中心的全球化到南北均衡的全球化为目标,也是我国新一轮对外开放的伟大愿景。国际