基于深度文本匹配模型的智能问答系统问题相似度研究

来源 :上海师范大学 | 被引量 : 6次 | 上传用户:zwj10191021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今飞速发展的互联网时代,随着人们生活水平的不断提高,人们在信息检索、自动问答、对话系统等人工智能领域的需求越来越高,需要智能匹配算法来满足用户的多样化需求。为解决这一问题,自然语言处理技术应运而生,它能够为用户提供高效的信息检索服务和舒适的人机交互体验。文本匹配任务是自然语言处理技术中的核心问题,近年来随着深度学习和文本词向量技术的迅猛发展,基于深度神经网络的文本匹配逐渐成为一个新的研究方向。本文研究了文本匹配一些经典的深度学习模型,基于ESIM、DSSM、Decomposable Attention、Siamese Network四种模型,根据Blending模型融合方法并在Blending上最后添加一层逻辑回归,提出一种融合模型。主要工作包括:首先,研究了文本匹配相关技术,包括词向量技术、卷积神经网络、循环神经网络、双向循环神经网络以及模型融合技术。其次,分别介绍了四种模型的基本结构,并在此基础上,针对本文实际问题进行模型构造,对四种模型各个网络层进行详细阐述,对损失函数、优化算法等进行说明。解释本文所提出的模型的构造过程。最后,根据2018蚂蚁金服文本相似度比赛数据进行实验,实验结果表明,ESIM模型在实际文本匹配任务中表现最好。在最终模型融合阶段,基于Blending模型融合方法,利用逻辑回归作为Blending的最后一层进行模型融合,应用到测试集上,准确率达到0.716537,召回率达到0.748,值达到0.73193054,均高于四种基模型。实验结果表明本文设计的模型能够通过Blending模型融合方法,充分利用不同网络架构之间的差异性,提取文本中的信息,发挥出各个模型的优势,提升模型的准确性。
其他文献
作为一种先进的氧化技术,光催化化学在有机污染物的降解和精细有机合成中发挥着巨大的作用.目前,光催化领域中广泛使用的两类绿色光催化剂分别为二氧化钛(锐钛矿结构)和多金属氧
大鳞副泥鳅属鲤形目、鳅科、副泥鳅属,俗称大板鳅、黄板鳅等。泥鳅在国内外水产品市场都有较强的竞争力,特别是东亚的韩国、日本和我国的港澳台地区,近几年泥鳅需求量逐年增
在田径运动的发展历程和各类大型的田径比赛中,跳远项目不仅由于其本身所具有的普及性和观赏性而深受人们喜爱,而且对提高人们的爆发力和跳跃能力,也起着重要的作用。我国女子跳远项目发展起步较晚,但经过我国科研人员和教练员的辛勤探索和付出,女子跳远也创造出了辉煌的成绩,曾多次夺得亚洲各赛事冠军并打破亚洲记录,目前亚洲记录仍然是由我国运动员姚伟丽所创造。尽管我国运动员在各大赛事中取的了非常优异的成绩,但在跳远
为了保障高等教育的质量,我国借鉴高等教育制度比较完善的西方国家经验,从2003年开始全面实施高等教育本科评估政策。通过两次主要的本科评估,专家发现在评估中如何平衡各方
水分是水稻生长发育过程中至关重要的因子,直播稻作为一种新型轻简栽培模式,具有省时、省工和节水等优点。试验于2018年在东北农业大学阿城实习基地进行,以龙庆稻21和绥粳18为试验材料,设置4种灌溉方式,分别为常规淹水灌溉(T1)、轻干湿交替灌溉(T2)、重干湿交替灌溉(T3)和为干旱管理(T4),探究不同灌溉方式对寒地直播稻生长特性、干物质积累与转运、产量及其构成因素和品质的影响,进一步明确最佳的灌
二硫酯调控的活性自由基聚合受控于可逆加成断裂链转移过程[1~3], 简称RAFT过程:
《半截蜡烛》是一篇略读课文,也是小学阶段唯一的一篇剧本。要让学生在短短一节课里,感受、认识剧本,可以抓住“玄机”“危机”“转机”“生机”这“四机”来探索剧本的秘妙。
反应扩散系统作为描述物质运动的基本方程之一,其所描述的大部分是非线性问题,具有丰富的动力学行为,分岔也是其基本的特征之一.分岔,作为非线性科学中的前沿课题,拥有着深刻的应用
近年来,我国道路交通事业发展日新月异,在现代城市人行桥梁建造方面,考虑到适应现有的车行交通网络,其线形往往是曲线的,且钢结构是容易造型的建桥材料。因此,曲线钢桁梁桥被
笔者的电脑安装有希捷ATA100 80GB硬盘,接在 第一个IDE口,设为主盘,前几天买了一台先锋DVD 刻录机,也支持ATA66模式,将其连接到第一个IDE口, 设为从盘,使用正常。但当笔者使