文本阅读任务中基于神经网络的问答技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:aiyang1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让机器能够理解人类的语言,并以自然语言形式进行问答交互,一直以来都是人类不断追求的目标。而文本阅读任务中的问答技术(Question Answering,QA)作为该问题下的关键技术,也一直是自然语言处理领域的主要研究方向之一。它是在给定文本语料的基础上,根据算法对问题的理解,来自动地回答问题。要正确地回答问题,既需要有一定的背景知识,也需要对问题本身有着深入的理解,同时还要有合适的生成答案的方式。随着深度学习技术的发展,神经网络(Neural Networks,NN)在语音信号处理、自然语言处理等领域都得到了广泛的关注。基于递归神经网络(Recurrent Neural Networks,RNN)的问答技术不仅能理解和记忆更长的文本,而且能对理解和记忆的内容根据问题进行有效检索,并生成答案,从而大大提高了答案的准确性,也解决了传统基于规则的方法费时费力而结果不佳的问题。本文主要围绕文本阅读任务中基于神经网络的问答技术展开研究,并选取了问答技术领域有较强影响力的数据集——斯坦福问答数据集(the Stanford Ques-tion Answering Dataset,SQuAD)作为评价数据集。首先,本文提出 了一套基于递归神经网络的条件编解码框架,并将该框架应用于SQuAD任务中,取得了远超官方提供的传统方法基线的效果。然后,在条件编解码框架的基础上,本文对问题理解(question understanding)做了进一步的分析和研究,并提出了基于树形长短时记忆网络以及问题词频滤波器的问题理解框架。对问题更深入的理解能帮助算法更好地找到正确答案,从而提高结果,实验结果也验证了这一点。进一步地,之前的模型框架都是对所有问题类型一起做的训练,而不同的问题类型还有区别于其他问题的特性,为了建模不同问题类型的区分性特征,本文提出了一种可端到端训练的问题自适应(question adaptation)方法。结合了这三项研究的最终模型在SQuAD的官方隐藏测试集中取得了第二名的成绩。
其他文献
提出了四肢变截面钢管混凝土格构柱抗震性能有限元分析方法,应用OpenSEES通用程序对试件进行建模,计算了格构柱荷载-位移滞回曲线与水平峰值荷载;以柱肢坡度、轴压比、长细比
随着公司业务范围的扩展及PPP项目的发展,施工企业从传统的施工总承包逐步向工程总承包(EPC)转型是历史发展的必然。从分析EPC模式特点及法律性质,本文专题对EPC合同模式进行
目的:观察黄连素对2型糖尿病(T2DM)伴非酒精性脂肪肝(NAFLD)大鼠肝脏的治疗作用,并探讨其作用机制。方法:采用高脂饲料合并小剂量链脲佐菌素(STZ)建立T2DM伴NAFLD模型,将其随
[目的]探讨PBL教学法在针灸实习教学中的应用效果。[方法]选择在针灸科实习的针灸推拿专业实习生60人,随机分为实验组和对照组各30人,实验组采用PBL教学法,对照组采用传统教
<正>我时常觉得,无论多厚的书,读完它很容易,真正读懂它却很难。如同我对待学生们,教他们知识很容易,要真正读懂和理解他们却并非易事。但作为老师,对学生的爱和理解却是必需
在竞争如此激烈的市场中,为了扩大产业规模并达到企业发展即时性的目的,大多数企业面临着两种选择,那就是并购或者被并购。一个成功的企业并购行为可以为并购企业更好的整合市场资源,引进专业管理性人才,进一步扩大自身的市场占有率,从而提升自己在市场中的地位;而一个失败的企业并购行为,不仅仅会消耗掉并购企业大量的运营成本,承受高额负债,同时也会因无法承受财务风险以及市场风险而被社会淘汰。所以研究如何提高企业的
兴趣是一个人积极参与某项活动主要的内在动力。针对小学生好动、活泼、注意力容易转移等特点,在体育教学中需要充分激发其参与到体育教学中的兴趣。文中对体育游戏在小学体
在工程实际中,一次二阶矩方法(FOSM)是一种常用的可靠性分析方法。在对非线性程度较低的功能函数进行可靠性分析时,一次二阶矩方法的传统梯度类迭代算法具有较高的计算精度和
强势语与强调结构在英语中广泛应用 ,因为人们普遍使用而显得十分通俗 ,故未见有语法书予以详细论述。其实 ,这是一个庞大的系统。本文拟作一尝试 ,对此进行较为精细的归纳和
水作为干旱半干旱地区生态系统循环和功能发挥的最重要限制因子,对植物生长发育、生存和分布起到关键作用。小叶杨、柠条、沙蒿作为该区典型的乔灌木植被,通过研究这3种植被