基于深度学习的知识图谱问答系统设计与实现

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:wyfwin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,数据量的飞速增长使信息越来越多,人们对信息的精准度要求也越来越高。传统的搜索引擎基于关键词检索,返回的是排序后的相关文档,仍需用户手动检索出答案。区别于传统搜索引擎,问答系统能够接收自然语言问题,并返回简洁而准确的答案。面向知识图谱的问答系统是问答系统的重要分支,它能够根据知识图谱中的结构化知识回答自然语言问题。知识图谱需要特定的查询语句进行访问,由于自然语言与结构化查询难以直接对应,该映射过程成为研究中的难点。基于规则和词汇映射的解决方案需要大量人力,覆盖率较低且缺乏灵活性。传统的机器学习依赖于人工制定特征的有效性,效果仍有待提升。近年来,深度学习发展迅猛,为自然语言处理领域带来了诸多突破,其中基于神经网络的序列到序列模型被证实在序列转化任务中具有显著的效果。本文依托深度学习的序列到序列模型将问题映射为知识图谱查询语句,在此基础上本文设计并实现了基于深度学习的知识图谱问答系统。本文的系统划分为Web服务模块、问题预处理模块、问题理解模块、查询语句生成模块、答案生成模块以及系统日志与知识图谱存储模块。问题预处理模块对问题进行句法分析、实体识别等。问题理解和查询语句生成模块对序列到序列模型进行改进,用于将问题映射为查询语句。答案生成模块根据查询语句查询知识图谱获取答案信息。针对上述映射过程,本文从句法结构入手,提出了基于分层注意力机制的知识图谱问答模型(Hierarchical Attention Mechanism based Model for Question Answering over Knowledge Graph,KGQA-HAM),该模型由编码结构和解码结构组成。其中,编码结构编码问题依存树各层子树,在问题与查询语句之间建立映射关系。解码结构基于分层注意力机制提取问题实体或关系语义,将其融入神经网络中生成查询语句。本文进行了对比实验,实验结果表明,本文提出的KGQA-HAM模型显著提高了将问题映射为查询语句的准确率及问答系统的F1值。通过系统测试,本文设计实现的问答系统功能和性能均符合预期效果。
其他文献
快速城镇化引起城市人口空间发生激烈变化,城市边缘区作为城市中最敏感的地区之一,凸显了人口空间重构的各种问题。本文以天津为例,基于全国人口普查数据,从时空两个角度系统
为建立稳定、高效的人工植物群落,必须对厚层客土喷播技术中的植物选择与植物群落的目标进行科学的确定。认为植物群落目标的设定应以遵循保证坡面稳定性的前提,实现与周围景
石刀是常见的生产工具之一,能够一定程度反映古代人类的社会生产活动。近些年来,由于考古学的发展,田野发掘工作的大量展开,全国各地各种各样的石刀资料也大大增加,因此具备
当前随着我国经济社会的迅速发展,人民生活水平的大幅提高,私家车和运输车辆的大量增多,导致道路交通压力的增加,进而交通肇事罪的发生率也普遍增高,而且相关的重特大案件也
随着城市化进程的加快,我国城市轨道交通建设迅猛发展。为实现信息互通、资源共享、保障地铁高效、安全运行,地铁综合监控系统得到广泛应用。地铁综合监控系统是一个集成多种
张爱玲,现代中国文学史上一位独特的、带有传奇色彩的天才女作家,上个世纪四十年代初期以小说集《传奇》、《流言》在上海文坛横空出世,她非凡的才情惊艳海内外。其作品主要
载人飞船返回舱减速着陆方式的选择直接关系到航天员的生命安全,是载人飞船总体方案设计中至关重要的一个环节。文章调研了美国、俄罗斯等国正在研制的新一代载人飞船减速着
太阳能发电具有干净、不会威胁人类和破坏环境的优点,提高太阳能板发电效率成为当今研究的热点;以单片机为控制核心,读取GPS的经纬度和当地时间等信息,根据视日运动轨迹模型
在社会经济快速发展的过程中,人们的生活水平不断提升,消费者膳食结构中低脂肪、高蛋白类水产品的比重也日益提升。由于鲜活水产品的收获期比较集中,水产品在自身酶解反应中
以红外成像制导反舰导弹为干扰对象,通过建模仿真,研究了制导误差对命中概率的影响,确定了3倍制导误差的激光压制干扰效果评估准则,提出了外场模拟评估设备要求和评估方法。