基于图注意力网络的多模态问题生成研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:Hollan720
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,人工智能底层研究日趋成熟,开始迈向涉及语言理解、图像理解和推理的高层应用研究,例如问题生成、机器翻译、图像描述等。其中,问题生成是最具研究价值和挑战性的任务之一,它需要在理解文本或图像内容的基础上,生成没有语法错误、可回答的自然语言问题,这一过程中还往往涉及推理。目前,对于问题生成的研究按输入内容的不同可以分为两类,其一是基于纯文本的问题生成,其二是基于视觉的问题生成。尽管,对于前者已有大量的研究,也取得一定的成效,但是其没有充分利用上下文结构信息和序列信息从而限制了模型的效果,而且生成的问题在可回答性方面存在不足。而对于后者,属于初步探索阶段,前人的工作主要聚焦于图像的底层信息,而忽视了图像所表达的高层语义信息,同时生成的问题在可回答性上也存在不足。基于文本的问题生成是多模态问题生成的基础,所以本文先对纯文本的问题生成进行研究,然后对视觉的问题生成进行研究。为了解决文本问题生成中存在的问题,本文提出一个基于上下文结构信息和序列信息的实体引导问题生成模型,用以同时捕捉上下文的结构信息和序列信息,以及提升生成问题的可回答性。该模型包含图注意力编码器、多特征编码器、答案-问题类型编码器、特征融合模块和解码器。其中,图注意力编码器用于捕捉上下文结构信息,多特征编码器用于捕捉上下文序列信息,答案-问题类型编码器用于编码答案实体和问题类型进而引导疑问词生成,特征融合模块用于融合结构信息和序列信息,解码器用于生成单词序列。通过在SQu AD数据集上进行大量的对比实验,消融实验以及案例分析。结果表明,与最先进的模型相比,基于上下文结构信息和序列信息的实体引导问题生成模型在文本问题生成中取得最好的效果,这证明了该模型的有效性。为了解决视觉问题生成所面临的问题,本文提出一个问题驱动的双通道视觉问题生成模型。该模型包含图注意力编码器、答案-问题类型编码器和解码器。其中,图注意力编码器用于编码实例级别的场景图,从而获得基于场景图的事件表示,答案-问题类型编码器用于编码答案实体和问题类型引导疑问词生成,从而提升生成问题的可回答性,解码器用于生成单词序列。通过在VQA2.0数据集上进行大量的对比实验,消融实验以及例子分析,结果表明,与基准模型相比,本文提出的问题类型引导的双通道视觉问题生成模型达到了可观的效果,这证明了该模型在视觉问题生成中的有效性。
其他文献
国网陕西省电力公司电力科学研究院(以下简称"国网陕西电科院")作为国网陕西省电力公司科研技术型支撑单位,肩负着为陕西电网发展运行、企业经营管理提供高端技术支撑的重要使命。背景与意义随着电网建设不断升级发展,国网陕西电科院技术支撑、科技研发任务量不断攀升,从国网陕西省电力公司对国网陕西电科院逐年增加的投资力度便可见一斑,
期刊
作为一名来自于老挝的留学生,来到中国留学之后,深刻感受到图像处理在老挝国内发展的速度比较缓慢。图像特征是物体普遍存在的固有空间属性,而纹理特征、色彩特征、文字特征提取是网络版民族特色图像处理、分析与应用的前提步骤,所以从图像中提取有效合理的特征值是准确识别图像信息的关键。图像固有特征分析技术被广泛应用于图像的识别、分类、分割、合成、检索等基于纹理的图像数字化处理,所以一直是数字图像处理领域的活跃研
在社会与经济的发展浪潮中,企业的管理模式也发生了较大的转变,其中引入了一项最为重要的理念,即“以人为本”,这种理念使得企业管理者能够更加人性化地进行管理工作。为了防止长期的劳累工作对员工的身体健康造成不良影响,同时也防止存在于实际工作环境中的不良因素对员工身体健康造成损害,企业致力于将更加健康的工作环境创造出来,在对员工岗位进行安排的过程中,也更多地结合他们的身体健康状态与心理需求等方面,力求将员
双模柔性传感阵列可以检测空间压力及温度的大小与分布情况,在人工智能、健康医疗等领域中有着广泛的应用。大部分多功能传感器要在外接电源能时能正常工作,电池的废弃与泄漏带来的环境污染不容小觑。伴随着摩擦纳米发电机(TENG)及自驱动技术的兴起,为解决电源的供给问题带来了有效的方案。本课题结合摩擦-起电效应与聚偏氟乙烯(PVDF)的热释电效应,设计出可同时检测压力与温度的双模柔性传感阵列。主要内容如下:(
随着不动产登记业务实施细则不断完善,围绕“一窗受理、并联办理”等业务目标,国家在不动产登记业务领域不断提出新的要求。传统的每个市、县分散式实施部署一套不动产登记业务系统的模式,存在资源浪费、数据分散、维护困难等问题。为进一步统筹整合不动产基础设施、数据资源、业务应用与服务系统建设,改进不动产业务应用模式,形成集约、高效、安全的不动产登记系统,本文从不动产登记业务实际出发,分析不动产登记业务流程,通
氧化铝作为机械、石油化工、冶金、化肥工业等行业的主要原材料,已被广泛应用在航天航空、医疗、汽车和半导体行业。针对氧化铝焙烧过程强非线性、流程长、检测滞后等特点以及传统的方法难以实现建模和优化的问题。以广西某铝厂为研究背景,高产优质低耗为优化目标,围绕面向质量产量能耗指标的氧化铝焙烧过程建模与优化开展研究,取得主要研究成果如下:(1)首先,分析焙烧过程的过程机理以及氧化铝生产指标、状态参数和操作参数
近年来,我国在积极推进特色小镇高质量发展。各地特色小镇建设和发展如百花绽放,取得良好的成效,涌现出一批产业特色鲜明、发展较为强劲的特色小镇,为全国其他地区的特色小镇建设提供了重要的经验。但很多特色小镇仍然存在产业基础薄弱、创新动力欠缺和发展后劲不足等问题。截止到2018年,各个省份共淘汰整改419个“问题小镇”,广西入选的14个全国特色小镇也可能面临淘汰整改。在特色小镇建设热潮中,特色小镇怎样才能
我国大中城市居民居住方式主要以高层建筑为主,高层建筑由于人员相对集中,空间小,一旦发生火灾,居民的生命安全、经济财产都将面临严重考验,如何在火灾的前期快速识别与消灭火灾成为目前重点研究的问题。本文针对实际家居环境,研究一种以物联网云平台为基础,结合多传感器数据融合技术与火焰图像识别技术的智慧家居火灾监控系统,旨在实现对火灾数据实时监控的同时提高系统对火灾识别的准确性,并解决系统实时性及可靠性问题。
近年来,我国的游戏产业不仅创造了较大的产值,而且促进了相关产业的发展。游戏产业已经成为娱乐产业和网络经济的重要支柱,甚至已经成为文化产业中非常有潜力的增长点之一,也正是由于网络技术如此发达,网络上才有越来越多的游戏。因此,如果希望游戏在市场上具有竞争力,则必须提高游戏质量,而游戏的用户体验决定了游戏的质量。游戏中角色自动寻路的路径搜索系统一直是一个非常重要的部分,现在游戏整个场景的地图正变得越来越
提质增效的智能加工模式是当下企业适应社会需求、应对激烈竞争的重要研究,可有效促进汽车制造等相关领域的先进加工技术蓬勃发展。工艺参数(主轴转速、进给量等)的选择对加工性能影响显著,参数组合的多样性使得生产机床具有较大的提升空间,如何选择合理有效的加工参数是本文研究的主题。为了实现加工过程中质量、效率和性能的多重权衡,本文以铣削TC18钛合金为例提出基于深度强化学习的提质增效加工优化模型,利用双深度Q