基于深度神经网络的多通道文本匹配研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jusso
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入二十一世纪,自然语言处理在计算机领域的应用不断拓展,人们在信息检索、问答系统、对话系统和智能客服等人工智能领域的需求开始出现。这些任务很大程度上可以抽象为文本匹配问题,文本匹配技术因此应运而生。文本匹配是自然语言处理领域中的关键核心技术,可以应用于大量的自然语言处理任务中。近年来,计算机视觉技术迅猛发展,将计算机视觉领域的相关技术引入到文本匹配任务中,已逐渐成为一个新的研究方向。本文通过研究近几年经典的深度文本匹配模型,发现文本特征提取没有同时考虑字、词、短语等局部信息以及文本的时序信息;也发现融合和提取文本匹配或文本交互信息时,没有更深层次的提取特征,也没有更好的保留文本匹配的局部信息。首先,针对文本特征提取问题,本文设计了基于卷积神经网络的深层文本特征提取方法,该方法能够同时提取文本字特征和词、短语等局部特征以及文本时序特征;其次,针对融合和提取文本匹配信息或文本交互信息的问题,本文设计了多通道特征堆积和提取的方法。基于文本匹配计算和文本交互计算,本文分别构建了基于卷积神经网络的多视角多通道文本匹配模型D-MPCPM和注意力机制下的多视角多通道交互文本匹配模型A-MPCIM,其中,D-MPCPM模型主要是通过不同匹配方法或模型参数得到多视角匹配矩阵,再采用深层卷积神经网络进行匹配特征提取;而A-MPCIM模型主要是两段文本特征进行交互,其交互方式是基于匹配矩阵来计算Attention权重进行交互,交互后的两段文本特征使用不同方法进行融合,得到多视角交互特征,再采用卷积神经网络进行交互特征提取。最后,本文在两个公开数据集上进行验证,首先,进行深层文本特征提取方法对比实验,实验结果表明:基于卷积神经网络的深层文本特征提取方法更加稳定,泛化能力更强以及能提取更多的文本特征;其次,再进行多通道特征堆积和提取的对比实验,实验结果表明:多通道堆积和提取优于Bi LSTM提取方法;最后,进行深度文本匹配模型的对比实验,实验结果表明:本文构建的D-MPCPM模型和A-MPCIM模型均优于近几年典型的深度文本匹配模型。
其他文献
经过四十年的改革开放的快速发展,中国城市发展即将进入稳定阶段,新时代城市发展应该满足人民生存、享受以及发展需要,满足老百姓对美好生活的追求,从城市“数量增长”转向“提升品质”。品质的好坏具有相当的主观性和个人化色彩,是感性的,其核心是人的感知,是不同主体存在多元的品质需求。将个体真正的需求视为品质,打造多元化、多层次的“居民可感知”的品质城市,而听觉是仅次于视觉感知的人类重要感知之一,城市可感知声
随着互联网科技的革新与发展,信息的交流达到了空前水平。同时也带动了存储技术的飞速发展。各行各业对存储设备提出了较高的要求。为了满足各种系统所提出的不同要求,发展一种大容量、高速度和低功耗的新型存储器成为目前科学研究的焦点之一。相变存储器(PCRAM)由于其高集成度、高读写速度、低工作电压和低功耗等优点,在存储领域有着广泛的应用。PCRAM的核心是以硫族化合物为基础的相变材料,主要有 GeSb、Sb
本文采用简单的水热法分别制备暴露{111}晶面的MnO八面体和暴露{001}和{010}晶面的SnxTi1-xO2-TixSn1-xO2准同型相界复合纳米片,对它们进行通氢处理,得到氢化后的MnO八面体和SnxTi1-xO2-TixSn1-xO2准同型相界复合纳米片,并对氢化后的样品采用透射电子显微镜(TEM)、多功能成像光电子能谱仪(XPS)、红外光谱仪(IR)、X-射线衍射仪(XRD)和场发射
随着汽车工业的飞速发展和汽车的日益普及,人们对汽车行驶过程中的安全性和驾驶体验提出了更高的要求,因此提升汽车的舒适性和安全性成为了现代汽车技术研究中的两大重要发展方向。车辆的转向系统和悬架系统在改善车辆侧向稳定性、侧倾稳定性和行驶平顺性方面发挥着尤为重要的作用,然而作为汽车底盘中的两个子系统,二者存在着动力学上的相互耦合关系,因而存在着系统间的协调控制问题。本文以分布式驱动电动汽车的主动悬架系统和
创新驱动作为经济发展的主力军,对行业市场竞争起着决定性作用。十九大报告中也强调我国在2035年将进入创新型国家前列,2050年成为世界强国。支柱性的建筑业必须在创新型国家的建设中担当重任,在新常态下建筑业必须走创新驱动发展之路。然而,在资源要素约束条件下,作为劳动密集型的建筑业如何依靠创新驱动实现转型升级和可持续增长,成为行业必须面临的问题。论文结合我国建筑业创新驱动能力现状,运用随机前沿(SFA
气敏传感器(Gas sensor)可以针对特定气体,在不同浓度下进行有规律的响应,相对传统的气体检测方法,其检测更加迅速、便捷,安全、廉价。经过近几十年的发展,气敏传感器已经被广泛应用于工业、农业、医疗健康等方面。相对于传统的单一金属氧化物气敏传感器,多元金属氧化物具有工作温度低、气体选择性好、性能稳定以及检测限相对较低等优势。其中,多元金属氧化物铁酸铜(CuFe2O4)因其在气敏传感器的抗湿性、
高分三号卫星是我国首颗分辨率达到1米的C频段多极化合成孔径雷达(Synthetic Aperture Radar,SAR)卫星,具有十二种工作模式。高分三号卫星还是我国第一颗被设计使用8年的低轨遥感卫星,能提供长时间并且稳定的数据服务,在各领域已经有广泛的应用。高分三号SAR图像道路检测是高分三号应用的一个重要组成部分,对地图更新、目标识别、影像匹配等方面具有重要的辅助意义。但是由于相干成像机理,
NO2作为一种常见的空气污染物,危害生态环境并威胁着人们的健康。因此,对NO2气体进行有力检测与监控变得尤为重要。气体传感器能够有效监控环境中的有毒有害气体。其中,金属氧化物半导体气体传感器因其具有响应速度快、灵敏度高、重量轻、成本低等优势而被广泛应用于NO2气体的监测。目前,研究者们致力于研究各种不同金属氧化物材料对NO2气体的响应性能。在各类传感材料中,In2O3具有宽带隙、低电阻率和较好的化
随着深度学习网络的发展,图像风格迁移成为人工智能研究领域的热门方向之一。风格迁移算法作为计算机科学与艺术领域的有效结合,赋予了计算机艺术再创造的能力。图像风格迁移技术不仅在学术界不断创新迭代,而且在工业界的应用也得到实践和拓展,其在商业价值和艺术创作等方面都展现出了巨大的潜力。目前,风格迁移技术主要是对图像整体进行迁移,对于西方画作的图像迁移,而仅针对图像局部区域、针对中国画的目标风格迁移研究相对
汉字的书写技能作为汉字学习和使用过程中的重要技能之一受到了广大汉字学习者及使用者的关注。然而汉字的识别模型复杂度较高,在实际应用过程中存在设备要求高、模型学习时间长等问题,同时汉字评价在字体美观度的客观因素评价与主观因素评价的权衡等方面存在一定争议。因此,针对这些问题,结合前期对基于力触觉交互设备的对外汉字教学的研究基础,提出了基于CNN的离线手写体汉字的多特性融合识别评价模型。针对模型的研究,主