耦合神经网络与符号执行的聚合型复杂问答的方法研究及系统实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:jill818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于知识图谱的问答系统(KBQA)应用越来越广,用户提出的问题也更加复杂,通常包含多个查询意图,需要进行逻辑,定量,比较等聚合型的推理运算。语义解析方法是一种实用的方法,旨在将复杂的自然语言查询转换为机器可执行的逻辑形式(logic form,LF),再通过模块化的符号执行得到最终答案。训练语义解析模型通常需要大量专家标注的“黄金(gold)”逻辑形式。但是在实际应用中,获得这种逻辑标注的成本很高。弱监督的语义解析模型只利用问答对即可进行训练,优先搜索可行的候选逻辑形式,再通过答案与逻辑执行结果的比较来获得监督信息。但在搜索过程中,可能会出现很多答案正确的错误逻辑,模型自身很难进行区分,也就很难搜索得到反馈更高的、完全正确的逻辑形式,从而阻塞了模型的优化过程。针对上述问题,本文耦合神经网络与符号执行方法,构建了弱监督语义解析模型,使得问答系统无需逻辑形式的标注即可完成训练。并且,尝试结合主动学习策略,使得系统能够主动选择问答示例的子集,请求额外的人工标注作为监督信息,排除虚假逻辑形式的干扰,打破优化被阻塞的状态,进一步提升问答系统的性能。本文的主要工作如下:(1)构建一个弱监督的语义解析模型。通过神经网络模型将自然语言问题转换成逻辑形式序列,再通过模块化的符号执行来回答聚合型的复杂问题。并且仅利用问题答案作为监督信息进行初始化训练。(2)提出了结合主动学习策略的方法。在训练好弱监督语义解析模型的基础上,启发式的选择一部分数据获取额外标注,排除虚假逻辑形式的干扰,避免解析器陷入局部最优解。(3)设置了多组对比实验。验证弱监督语义解析方法的有效性,以及结合主动学习策略对系统性能的提升。对比不同的选择策略和标注方案的影响。(4)构建聚合型复杂问题的问答系统。基于本文提出的问答方法,设计并实现了基于知识图谱的,聚合型复杂问题的问答系统,经过测试,满足系统的各项需求。
其他文献
城市排放的温室气体占全球温室气体总排放量的75%,而建筑作为与工业、交通并列的能源消耗的三大领域之一,是温室气体排放的重要来源。统计数据显示,城市能耗的60%左右可归为城市建筑能耗。随着我国城镇化率的提升,城市建筑能耗逐年提升,城市建筑节能工作迫在眉睫。城市能耗模拟是实现低碳、低能耗、生态城市的重要技术支撑,通过物理模型对城市能耗进行精确的模拟需要的建模和计算量非常巨大,有效手段之一是利用建筑原型
当前社会发展己经处于第四次工业革命阶段,科学技术日新月异。其中有些前沿的科学技术如网络大数据、人工智能、可视化编程等也逐渐出现在风景园林学科的研究中,为定量分析研究景园建筑提供了可操作的技术平台。本文所研究的景园建筑与环境融合的调控技术,可以促进整体景园环境评价、建筑选址和体量控制的科学化,为有效提升景园空间品质提供助力。景园建筑与环境的融合是一个复杂的问题,不仅涉及到景园建筑及环境的整体空间布局
安顺屯堡文化是一种特殊的由异源文化融合而成文化现象,其在各个文化与物质层面都具有重要的研究价值与地位,是研究中国传统聚落的历史学、建筑学、人类学、社会学的宝贵的实物资料。而云山屯作为其中一个独特的存在,依附特殊地形,经历了防御功能向商业功能的历史转变。云山屯在强烈的适应性与灵活性下形成了丰富的物质空间层级,是典型且丰富的建筑构成与日常观察的研究素材。云山屯的显性与隐性构成系统是一种在长期相互交织的
随着大数据时代的到来,计算机硬件能力正不断提升,数据信息的获取也越来越便捷。计算机视觉、自然语言处理和语音识别等技术不断进步,人工智能领域的各种应用也逐渐走进人们的生活。随着人工智能的核心技术——深度学习技术的不断发展,基于深度学习的目标检测和跟踪技术成为计算机视觉领域的热门课题,并广泛应用于智能监控系统和互联网移动端。其中,对于视频的目标检测与跟踪算法一直都是研究的难点和热点,也具有极其重要的科
随着装配式建筑体系的推进和发展,预制墙板配套砂浆得到了广泛的推广和应用,但现有的砂浆存在易开裂、收缩大和粘结性能低等一系列问题。本文针对装配式构件连接用材料的无收缩、高抗裂、高韧性等需求,研究水胶比、聚灰比、粉煤灰、固体养护剂和纤维对粘结砂浆性能的影响。结果表明,提高聚灰比和粉煤灰掺量可以有效降低砂浆的收缩,提高抗裂能力。降低水胶比和提高聚灰比可以提高砂浆的粘结性能,但会降低砂浆稠度。适量的固体养
在多式联运业务流程中,单证系统起着联结各多式联运参与方的重要作用。区块链作为近年来较为火热的研究方向,在信息系统构建与业务流程优化方面有巨大的探索空间。基于上述背景,论文探索使用区块链工具优化现有多式联运单证业务流程及基于区块链的多式联运单证系统的实现细节。首先,探索使用区块链工具对现有单证流程进行优化。通过基于现有单证业务流程和使用区块链工具优化后的业务流程分别建模,得到区块链技术在现有单证业务
第一部分TNFAIP3在人和大鼠正常及退变椎间盘髓核组织中的表达变化目的明确TNFAIP3及NF-κB通路相关信号分子在正常和退变椎间盘髓核组织中的表达变化。方法搜集临床人正常与退变髓核组织并采用免疫组化法观察正常和退变髓核组织中TNFAIP3表达变化;利用针刺法构建SD大鼠IVDD模型,分别提取正常与退变髓核组织的m RNA和蛋白(4周、20周、20周穿刺退变、50周),采用实时定量聚合酶链反应
目的:躯体症状障碍(somatic symptom disorder,SSD)是以一种或多种突出的令人痛苦的躯体症状为主要特点,同时伴与躯体症状或健康相关的不恰当的感受、想法或行为的一种精神障碍。SSD患者花费过多的时间、精力关注躯体症状而严重影响了日常生活和社会功能。本研究探讨SSD患者大脑白质(white matter,WM)结构和功能连接(functional connectivity,FC
飞行器如无人机(Unmanned Aerial Vehicle,UAV)等在生产生活中的广泛应用,让自主飞行控制变成飞行器领域的核心技术和重难点问题。如何设计实现高效优质的自主飞行控制系统成为新一代智慧飞行器设计制造的关键问题之一。目前大部分飞行控制研究关注的是低延时下的人为控制;或者是编制好任务路径以硬编码的方式让飞行器按照规划好的路径前进以完成任务。这两类飞行器控制技术均不能脱离人的控制和规划
由于具备体积小,价格实惠和控制稳定的优点,多旋翼无人机近十年来被逐渐广泛应用在各个领域,亦被广泛研究。其中基于单目视觉的无人机障碍规避是众多研究问题中有挑战性的问题之一,该研究对机载传感器要求低,且对于无人机小型化智能化,多传感器融合与灾备有重要意义。同时,在深度估计研究中所提出的自监督深度估计方法大幅度降低了构建数据集并训练对应场景下深度估计模型的难度,这使得基于单目深度估计的无人机避障具有高可