知识库问答中复杂问题的结构化查询生成方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:gfjgds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向知识库的问答是信息检索的一种高级形式,具有非常重要的研究价值和应用前景。针对用户提出的自然语言问题,经过分析处理后,从知识库中查询或者推断出问题的答案。语义解析的方法就是目前广泛研究的一个方向,将自然语言问题转化成与之相对应的知识库结构化查询语句,最终在知识库中查询获得答案。本文主要针对于复杂问句的知识库问答任务,结合复杂问句多实体、多关系、多约束的特点,通过语义解析的方法将复杂问句处理分析并提取出语义要素,进而转化成知识库能够理解的结构化查询语句,实现知识库问答。整体的语义解析流程包含四个阶段:实体链接,关系检测,约束检测,结构化查询生成。其中,前三个阶段从问句中提取出的语义要素(实体,关系,约束)作为第四个阶段结构化查询生成的支撑。本文在利用现有工具获得实体链接结果的基础上,提出了一种多注意力机制下的复杂句多关系检测方法,提出了复杂问句中多种约束的检测方法,提出了基于SPARQL-Tree作为中间状态的复杂问句结构化查询生成方法。本文的主要贡献如下:(1)提出了复杂问句的语义要素检测框架。提出了一种多注意力机制下的复杂句多关系检测方法。根据问句中不同的关系数量,采取不同数量的注意力机制下的问句和候选关系的编码相似度比较,从而得到问句中的多个关系。提出了复杂问句中多种约束的检测方法。针对于复杂句中每一种常见约束,包括查询意图、排序、过滤等,采取不同的约束识别方法完成约束检测。(2)针对结构化查询生成步骤,提出了基于SPARQL-Tree作为中间状态的复杂问句查询构建方法。为了弥补复杂问句和结构化查询之间的巨大语义鸿沟,本文提出SPARQL-Tree作为中间状态,将结构化查询语句的生成看作一个树(SPARQL-Tree)的生成过程。利用SPARQL自身的上下文无关文法,构建出SPARQL-Tree由粗到细、自顶向下的双层解码生成过程,从而得到结构化查询语句的总体逻辑骨架,进而填充语义要素以丰富骨架细节,得到最终的结构化查询。(3)在3个常用的复杂问题的知识库问答数据集上进行了验证,实验结果表明,本文提出的方法取得了良好的表现,针对复杂问题的处理取得了不错的效果。同时,实验分析了语义要素检测对最终结构化查询生成的影响,SPARQL-Tree作为中间状态的作用,验证了本文提出的知识库问答方法的有效性。本工作的意义在于,为复杂问句的知识库问答任务提供了一整套有效且可解释的解决方案。通过分析整个语义解析的流程,可以有效的理解复杂句的语义分析以及结构化查询的构建过程,同时还可以辨别出整个问答任务中误差出现的原因,对于今后更加复杂的问答场景具有借鉴意义。
其他文献
随着我国城市化进程的迅猛发展及城市轨道交通网络的快速形成,超深基坑工程数量逐渐增多,地质环境条件愈发复杂。城市地面资源日益紧张、地下空间更深层次的开发将导致基坑内开挖到岩层的情况趋向常态化,而目前国内外对于土岩复合地层深基坑开挖变形规律的研究较少,且具有一定的区域性,该类基坑的设计及施工仍沿用软土地区基坑的方法,理论及经验的匮乏在一定程度上影响了该类特点基坑的稳定性、施工安全性及经济性。因此开展土
学位
学位
随着酒店服务行业的快速发展,酒店的智能化系统扮演着越来越重要的角色。然而目前国内酒店智能化方案设计大多是方案的跟风与复制,缺少深入的市场调研和方案创新,这就可能造成资源与成本的浪费。基于此背景,本文结合工作中接触到的酒店项目的智能化系统,利用价值工程方法对此问题进行了相关的研究与分析。本文先从国内外建筑智能化系统的产生与发展入手,梳理了建筑智能化系统的主要内容与发展现状,然后将重点聚焦于酒店建筑的
直方图个性化统计特征涉及个体隐私,直接发布将不可避免地带来隐私泄露问题。近年来,差分隐私以其对背景知识的弱依赖性,在隐私保护直方图发布领域得到持续关注。隐私保护直方图发布研究目前主要集中于数据集直方图一次性发布以及数据流直方图连续发布领域,已有数据集直方图一次性发布方法采用分组思想降低发布直方图误差,存在无法有效均衡分组近似误差与拉普拉斯误差问题;已有的数据流直方图连续发布方法研究较少,且侧重高实
学位
近年来,随着长三角地区高铁建设网越来越密集,高铁沿线的新城迅速发展。目前新城建设中地下空间开发力度越来越大,大量邻近高铁桥梁的地铁车站、建筑物深基坑相继出现。由于高铁运营速度快,对轨道平稳性要求高,基坑施工过程中降水、开挖及堆载耦合作用造成的多源加卸荷环境容易对邻近高铁桥梁桩基产生不良影响。因此,开展长三角软土地区深基坑工程多源加卸荷环境诱发的邻近桩基受力变形、承载性能弱化及其保护措施的研究,已成
学位
基桩加固坡岸的稳定性是保证其工程安全施工和运营的重要指标。由高强度预制混凝土管桩内芯插入水泥土搅拌桩外芯而制成的劲性复合桩兼具两者承载性能优点,工程应用前景广阔。但截止目前,对劲性复合桩加固坡岸的稳定性分析研究尚处于探索阶段,已有成果难以指导工程实践。本文采用现场试验、数值模拟和理论分析相结合的方法,对劲性复合桩加固坡岸稳定性分析方法展开系统性研究,研究成果可为现有劲性复合桩复合地基稳定安全系数计
随着无人机技术的日益成熟,利用无人机进行区域覆盖航拍并获取任务区域全景底图具有重要的现实意义和广泛的应用前景。对于大面积区域,采用单无人机多架次执行区域覆盖任务耗时长,效率低。因此,本文研究如何利用多无人机共同完成区域覆盖任务,并搭建多无人机区域覆盖系统,实现算法的实际应用。本文主要研究工作如下:首先,针对四旋翼无人机的结构特点与飞行原理,提出一种基于栅格法的多无人机区域覆盖环境建模算法,并建立多