基于注意力机制的视觉问答任务研究

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户:lwjjet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于注意力机制的视觉问答系统,通过匹配图像中与问题相关的区域来回答基于图像的问题。通过拼接的方式将问题特征与图像特征映射到一个共享空间,再通过非线性层、线性层以及Softmax层来得到注意力权重。该方法将视觉问答任务视为一个多分类任务,将数据集中出现频率最高的1 000个答案作为候选答案。利用预训练的VGG16模型提取图片特征,利用LSTM网络提取问题特征,采用VQA数据集进行训练和测试。
其他文献
太仓县位于长江入海口,南邻上海、西靠苏州。改革开放以来,商业部门以市场为导向,积极参与市场竞争,经营规模不断扩大,经济效益明显提高,企业后劲大大增强。今年销售总额可望
目的:探讨彩色多普勒超声诊断视网膜瘤的应用价值。方法:使用美国Acuson128xp/10、HP8500彩色超声诊断仪检查视网母细胞瘤28例(30只眼),正常儿童对照组14例(28只眼),测其视网膜中央动脉收缩期峰值、舒张末期的血流
随着移动互联网的兴起和智能手机的普及,根植于移动终端的微型电商开始火起来。中国一拖经销商通辽广联农机公司通过强力推进电商业务,开设“东方红专营店”手机微店,在农机
目的:了解哮喘患者对哮喘知识的掌握状况.方法:用12项哮喘知识是非题对61例哮喘患者和61例配对健康成人进行问卷调查,每项1分.结果:哮喘患者平均得分(9.19±1.91)分,对照
目的 探讨体外循环心脏不停跳心内直视手术中血液稀释的安全性。方法 对186例在浅低温体外循环心脏不停跳条件下行心内直视手术的患者进行术中血液稀释,并对血象、脑氧饱和度及
兴趣是学习最好的老师 ,大量的调查证明 ,凡是那些学习成绩好的学生 ,大多是对学习产生浓厚兴趣的学生。作为一名大学教师 ,如何引发学生的学习兴趣是在教学工作中取得良好效
期刊
海门市食品总公司总经理俞凤标在整个食品行业困难重重、举步维艰的境况下,以过人的胆量,一步一个脚印地走出了食品企业长期在困境中徘徊的误区,找到了一条办好一站、一店、
英语作为国际通用交流语言,将其熟练运用会对学生今后发展起到至关重要作用。人类语言形成与发展,都与其国家 和民族存在紧密联系,所以学习一门语言不能脱离其国家和民族文化