基于深度神经网络的问答系统关键技术研究与应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:zsq789456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统作为一种重要的人机交互方式,以自然语言的形式直接且准确地回答用户问题,逐渐在信息检索、智能服务等应用中展示出更有效的性能表现。同时,由于深度学习的发展及计算能力的提高,问答系统任务中也引入了更多的深度学习技术,促使该领域逐渐从基于特征工程或浅层语义分析的信息检索向基于深度理解的智能问答转变。其中,利用自然语言处理技术表示人类语言,并对其进行语义理解和知识推理仍是当前问答系统研究工作的重点及难点。本课题选择能够捕获用户问题和相关文章间深层语义联系的机器阅读理解模型作为问答系统的深层神经网络,以端到端的方式设计实现一个阅读理解型问答系统,并对该问答系统中的部分关键问题进行深入研究,利用深度学习中的预训练语言模型、注意力机制等技术来改进问答系统。最终较大幅度地改善了问答系统的知识来源、上下文建模与知识表示、语义理解等多个方面,有效地提升了问答系统的性能。本课题的研究工作如下:(1)文本表示方面,提出了基于多阶段特征融合的文本表示方法。首先详细分析了中文汉字的造字特点以及现有中文表示模型的局限性,提出了适合汉字表示学习的形态学n元组中文表示方法;接着,从语法范畴和预训练语言模型中提取不同粒度的特征向量,作为原始文本的语法和外部知识补充,并采用多阶段特征融合的方式对不同粒度的特征向量进行融合。最后,通过实验验证了基于形态学n元组的中文表示方法的优越性以及多阶段特征融合方法的有效性。(2)语义理解方面,提出了基于层次注意力机制的机器阅读理解模型HANet,形象地模拟人类由浅到深的理解过程。该模型将不同种类的注意力机制应用于多个网络层中,实现了在不同的粒度级别上捕获问题和文章之间的关系,逐渐将注意力集中在最佳答案边界部分,最后通过推敲细节预测出正确的答案。通过在不同数据集上进行多组实验,验证了该模型的有效性。(3)应用方面,以端到端的方式设计并实现了一个基于深度神经网络的问答系统,为电子科技大学校友提供实时的问答服务。该问答系统基于(1)(2)中提出的方法模型构建,并通过微信和Web网页两种方式与用户进行交互。用户在任一客户端上提交问答请求,问答系统将向用户返回简短且准确的问答结果。
其他文献
对于吴晓灵而言,专注于金融改革与创新既是一种职业担当,同时也是其个人愿景。翻看吴晓灵的履历,会发现这位学者型官员所从事的事业脉络异常清晰。
宁夏是西部地区、民族地区,也是欠发达省区,贫困人口占比高.贫困程度深,脱贫攻坚任务非常艰巨。3月6日,《中国经济信息》记者采访了全国人大代表、宁夏回族自治区主席成辉。咸辉代
(淮北师范大学,安徽 淮北 235000)  摘要:高校学生活动作为高校学生生活的重要组成部分之一,学生活动的重要性不言而喻。就目前高校学生活动开展的现状来看,主要存在形式单一、创新不足、流于形式、学生参加学生活动时功利性太强、高校学生团体组织学生活动时经费匮乏和场地不足等问题。通过对高校学生活动问题的思考,提出了改善学生团体开展学生活动的对策,为学生团体的发展创造良好的内部及外部环境和条件,以促
“从宏观经济的基本面和政策面来看,积极的因素仍占主流,把握新时代下改革的主攻方向,2018年中国股票市场的结构性机会将比2017年更多。”
知识是企业持续竞争优势的重要来源,获得有价值的知识是企业基业常青之本,而战略联盟通过组织学习为企业提供了获得知识的有效途径,保持了企业的竞争优势和创新能力。通过对