基于深度学习的多段落阅读理解系统的设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:Eltonxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,越来越多的互联网用户从海量非结构化的网页中获取所需信息。然而,当前主流的搜索引擎针对用户提出的问题只能返回多个篇章级的结果,并且这些返回结果存在很多干扰信息,因此用户需要对返回的结果进行判断筛选才能真正得到所需信息。这个过程不仅增加了用户检索的难度同时也增加了用户搜索时间。因此论文研究实现了多段落阅读理解系统,可以给用户返回更加精准的答案。多段落阅读理解算法指给定问题和多个段落机器自动从给定的段落中抽取出答案。然而,多段落阅读理解算法存在文本长度过长导致阅读理解效果差、候选答案排序算法不能综合多方面文本语义信息等问题。因此,为提高多段落阅读理解算法的性能和可用性,论文研究改进了多段落阅读理解算法,并基于改进算法实现了多段落阅读理解系统。主要研究内容包括如下三个方面:(1)首先,论文实现了基于依存句法关系和注意力机制的阅读理解算法。针对长文本下传统注意力机制对所有词都计算注意力权重引起噪声干扰的问题。论文所提出的模型在Bert输出的基础上只对有依存句法关系的词组计算注意力权重,有效降低了无用信息对语义表达的误导。实验表明,论文提出的模型取得了比match-LSTM、BiDAF和Bert更好的预测效果。(2)然后,论文实现了融合文本蕴含关系特征和多种其它文本特征的候选答案排序算法。针对候选答案排序算法不能融合多方面语义信息的问题。论文所提出的模型融合了问题、文章及段落三者之间深层的语义关系。实验表明,论文提出的模型取得了比DrQA、R3、HAS-QA和RankQA更好的预测效果。(3)最后,采用VUE、Flask、JavaScript等技术设计实现了多段落阅读理解系统。系统包括五个模块,分别是web服务模块、算法模块、数据获取模块、基础支撑模块和日志存储模块。同时结合系统的功能性需求和非功能性需求对各个模块进行了详细地设计和实现。测试结果表明,多段落阅读理解系统满足系统需求并达到预期目标。
其他文献
学位
学位
学位
食品安全问题是关乎人民生命财产和国家安全稳定的重要问题。在实际生产生活中,大量的食品安全隐患是由食品的长时间储存引起的。研究显示,随着食品储存时间的增加,其蕴含的营养物质会大量流失,其中的微生物也会迅速繁殖。因此,食品安全检测技术受到了研究人员和科学家们的广泛关注。近些年来,太赫兹技术取得了长足的发展,众多研究将其引入食品安全检测领域,成为了一种极具前景的手段。本文研究了太赫兹波在不同储存时间苹果
米尔恰·伊利亚德是宗教现象学的代表人物,克洛德·列维-斯特劳斯是结构功能主义之父,二者都是二十世纪重要的理论家,都将神话作为研究对象,通过对神话的分析和阐释形成了各自的神话理论。两种神话理论产生于同一时期,在相同的大背景下,二人从自身学科理论基础出发,运用各自的研究方法,从不同角度、不同层面对神话展开论述。他们各有侧重,对于神话都给出了具有鲜明个人特色的理解。两种神话理论的相继问世,势必会发生碰撞
问题情境是教育者在教学过程中,为了达到既定的教学目标,有意识地创设能够引起学生思维和认知上的冲突,引发学生进行质疑问难,激发学生探求解决问题兴趣的一种教学情境。将问题情境运用于高中《生活与哲学》教学中,发挥问题情境的优势,有助于激发学生的学习动机;有助于促进理论与实际的联结;有助于锻炼学生的综合思维能力。从而提升《生活与哲学》课的教学实效。结合问题情境与高中《生活与哲学》的特点,可将问题情境分为对
学位
研究目的:课题组前期筛选并创建了结直肠癌转录组数据库,数据提示LARP1是潜在的结直肠癌相关基因。本研究旨在研究LARP1在结直肠癌中的表达情况及生物学功能。方法:应用Real
学位
学位