基于深度学习的答案融合方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wanglt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统是自然语言处理领域的一个重要任务。以“问答对”为基本成分的语料库是自动问答系统答案的主要来源,语料库中的“问答对”一般都从百度知道、知乎等问答社区中抽取的。然而,问答社区中的一个问句通常有多个答案,从不同的角度回复问句,自动问答社区中的答案却只选取其中一个答案作为问句的回复,这就导致语料库中的答案不够全面。因此,本文研究答案融合方法,将多个候选答案进行融合,从而解决自动问答系统语料库存在的不全面、冗余等问题。本文使用深度学习方法、注意力机制等方法解决答案融合问题。答案融合方法是从多个候选答案中抽取答案,因此答案抽取的准确性,决定了答案融合方法结果的准确性及全面性。同时答案融合方法得到答案是从多个候选答案中抽取的,语义存在着不连贯、可读性差的问题。因此本文从答案自动抽取及语义连贯性两个方面提升答案融合效果。答案自动抽取能够从多个候选答案抽取中能够答案问题的答案句,使答案更加精简、更加全面。语义连贯性通常表现为段落内的句子顺序,因此使用句子排序方法解决答案语意连贯性问题,增强候选答案间的语意连贯性,使答案融合结果可读性更好,语义更连贯。本文主要研究工作围绕答案自动抽取以及句子排序展开,分为以下四个方面:1、基于词共现的答案自动抽取模型。本文利用句内注意力机制对问句及答案句进行特征提取,同时针对语料,引入词共现特征、文档倒数特征、词相似度特征,并采用随机采样方法处理语料中存在的数据不平衡问题。对比基线方法,基于词共现的答案自动抽取模型能够提高抽取答案的准确度。2、基于句子匹配的句子排序方法。本文将深度学习方法引入句子排序中,使用深度学习方法解决句子排序问题,同时将句子匹配方法引入句子排序中,对比基线方法,模型提高了句子排序方法的效果。3、基于注意力机制的句子排序方法。为了增强句子排序模型捕捉语义逻辑关系的能力,将注意力机制引入句子排序任务中,实现了基于静态注意力机制的句子排序模型、基于词对齐注意力机制的句子排序模型以及基于句内注意力机制的句子排序模型。基于注意力机制的句子排序方法能够有效捕捉句子间语义逻辑关系,提升句子排序效果。4、答案融合系统设计与实现。对答案自动抽取模块及句子排序模块进行整合,实现答案融合系统,解决语料库构建中存在的语义不全面、冗长的问题
其他文献
有数据表明,现在中国每年用于体育赞助的总额约50亿元人民币,已超过了各级政府用于体育事业经费的总和。随着体育社会化、产业化进程的不断深入,建立和完善体育赛事与企业赞
导叶漏水量是评价水轮发电机组品质和状态的重要指标之一,其测量方法应结合电站实际情况合理选择。利用超声波测流法操作简便、测量时间短、测量精度高等优点,在某电站用超声
句子排序是多文本摘要中的重要问题,合理地对句子进行排序对于摘要的可读性和连贯性具有重要意义。该文首先利用神经网络模型融合了五种前人已经提出过的标准来决定任意两个
<正> 一、前言 1972年11月,在一条长14km的隧道里发生了一场列车火灾,使30名乘客丧生,数百人受伤。自那以后两年半的时问里,日本国铁一直在研究列车防火的办法,并已成功地解
2012年,横山县扶贫办深入贯彻落实科学发展观,紧紧围绕白于山区移民搬迁、整村推进、农业综合开发和劳动力转移培训等重点工作,扎实开展扶贫开发工作。认真贯彻落实新时期扶贫开
根据地表脉冲源激震产生的瑞雷面波(P波S波)在弹性分层的半空间介质中传播速度的差异,测试地基土层的动力性质,以评价其动力性能及其对地震反应可能产生的影响。以滕州市荆河
近年来,全国各地经济开发区特别是国家高新技术产业开发区和国家经济技术开发区不断发展壮大,在我国经济建设和推进城市化进程中发挥了重要的作用,成为国内最具增长活力的经济区域。随之而来,如何加强这些经济区域的民主法制建设,保证宪法和法律有效贯彻实施,业已摆上地方各级党委、人大的议事日程。本文尝试对国家高新技术产业开发区和国家经济技术开发区(以下统称开发区)设立人大工作机构的有关问题作简单的分析和探讨,以
利用有限元分析法计算得到了良好绝缘子串内部、沿面及空间电场分布情况,并对绝缘子串不同位置存在零值绝缘子时的空间电场进行仿真,研究了零值绝缘子对整体绝缘子串电场分布