面向Simple Question的自动问答方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:cntt_nj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答是自然语言处理领域内的经典问题。随着知识库的快速发展,越来越多的开放知识库被建立起来。知识库作为一种优秀的知识结构化存储和组织方式,既可以结构化存储海量的知识,还可以保存知识之间的联系。但是知识库的结构化存储模式(例如,RDF),让用户很难直接获取其中的知识,而问答系统可以在用户和结构化存储的知识库之间架起一座桥梁。以知识库为基础的问答,可以充分发挥知识库的优势,快速地提供知识服务。自然语言是理想的人机交互方式。通过问答,人们可以方便地自主获取知识库中结构化存储的知识。但是自然语言与结构化存储的知识库之间存在的语义鸿沟以及知识库中海量的事实都为问答带来了很大的挑战。如何快速让计算机理解自然语言并快速检索出对应答案具有重要研究意义。本文主要研究面向简单问题的知识库自动问答方法,简单问题是指问题可以由知识库中的一条事实(subject,predicate,object)来回答。本文的主要研究工作如下:(1)研究了基于pipeline的自动问答方法,将问答任务分解成实体检测和关系检测两个子任务,通过建立实体识别模型、关系匹配模型来共同完成问答任务。此外通过建立问题与实体类型的匹配模型,利用上下文信息提升了问答效果。(2)研究了基于端到端的自动问答方法,将实体检测和关系检测两个子任务合并,融入到一个框架中。通过循环神经网络对问题、实体和关系进行编码,将三者的语义向量映射到同一语义空间,然后再分别计算实体、关系与问题语义向量的余弦相似度,从而实现对候选答案的排序与选择。针对端到端模型,本文提出了一种有效的负采样方法。(3)构建了融合上下文信息的多任务端到端模型,在SimpleQuestion数据集上,对比现有的端对端模型,准确度从71.2%提升到了71.8%,并且模型训练时间从48h减少到4h。针对端对端问答实验结果,进行了错误样例分析。根据错误样例分析,分别研究了自注意力机制、实体候选集大小以及负样本比例对于模型训练效果的影响。
其他文献
近几年计算机视觉的应用越来越普遍,比如刷脸支付、3D模型复原、自动驾驶等。这些技术中很重要的一环是在获取场景的三维信息。普通相机往往只能获取二维图像,这使得原本的三维场景不能完整地被获取。深度测量技术能让我们获取实际场景中各个物体的相对距离关系,弥补了三维信息丢失的缺点。目前深度测量的方法有很多种。本课题就主要采用液晶透镜作为成像器件通过离焦与聚焦两种方法来获取场景的深度信息。液晶透镜是一种新型的
晚高峰交通枢纽的瓶颈问题是亟需解决的老大难问题。在中国大都市尤其是CBD区域,晚高峰通勤的需求大于公共交通的运行能力,造成了交通拥挤甚至交通事故的产生。交通枢纽的瓶颈问题直接制约着人们的出行活动安排。对于这一问题的解决方式一是通过扩大道路交通供给,提供更多的出行方式选择;二是从交通需求的角度,诱导通勤者的出发时间、出行模式的选择,从而避免交通瓶颈的拥挤现象,提高出行效率,实现轻松出行。对于第二种解
随着大数据时代到来,同一种数据往往能够从多种数据源获取,并且越来越多的特征抽取器被设计,因此多视角学习受到学者们的广泛重视。多视角聚类是聚类中的一个重要研究领域,充分利用多个视角之间的补充信息能够提高聚类性能。本文基于多视角聚类算法展开研究,针对现有多视角聚类算法中多视角特征抽取与聚类分离造成聚类性能不佳的问题,设计基于联合学习框架的深度多视角聚类算法,能够有效提升多视角聚类的性能。本文的主要贡献
为了满足农村融资需求,盘活土地资本,我国各地纷纷开展了农地抵押贷款试点。在政府层面,我国政府已出台多项文件为农地抵押贷款试点的推广提供了政策性的支持。现有的比较典
人工智能是当今各研究领域内关注的热点,人工智能技术在近年来也得到了飞速地发展。群体智能是人工智能的重要分支,群体智能算法的种类非常丰富,目前应用广泛的群体智能算法主要有:蚁群算法(Ant Colony Optimization,ACO),人工鱼群算法(Artificial Fish-Swarm Algorithm,AFSA),人工蜂群算法(Artificial Bee Colony Algorit
多年来,金融服务是制约我国农村经济社会发展的重要因素。由于农村地区的金融交易总量少、需求分散、频率低、风险大、成本高,农村金融机构仍然存在网点数量少,结构不合理等
研究人员从三个不同的角度研究影响员工工作效率的因素。从个人角度(员工敬业度),组织角度(感知组织支持)和外部或家庭角度(家庭工作资源溢出)来看这些。使用152名员工的调查数据。研究人员发现,从个人角度来看,员工敬业度与工作效率有关,从组织角度(感知组织支持)积极地与员工工作效率相关,从外部角度(家庭工作资源溢出)与员工工作效率积极相关。结果表明,员工对某些活动的参与可以提高工作效率。因此,实体应制
制造业是我国的第二产业的重要组成部分,是工业化的动力来源,它的发展直接体现了一个国家的生产力水平,是衡量一个国家经济实力的重要标志,也是保证国民经济稳定发展的基石。改革开放以来,制造业始终是我国国民经济最活跃的增长点,2018年,我国制造业的增加值已经达到了 264820.40亿元,占我国GDP比重的29.41%,可见制造业在我国国民经济中所占据的重要地位。尤其是2015年我国提出了《中国制造20
随着城乡一体化进程不断加快,农村劳动生产率提高逐渐成为主流问题,如果基于现有的制度体系,全面提升职业农民的培训力度,使他们全面掌握劳动生产、经营及服务技能,逐渐提升
在计算机视觉研究领域中,目标跟踪作为计算机对外界信息深层解析的基础,无论在国防军事还是在生产生活中都有着不可或缺的应用需求。在实际应用中,复杂多变的环境条件给目标