基于深度学习的人机对话模型的研究与设计

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ejian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实现人和计算机使用自然语言进行交互,是自然语言处理领域的一项重要工作。随着人工智能技术的发展,尤其是深度神经网络的广泛应用,构建基于开放领域的对话系统已经越来越受到人们的关注。互联网的快速的发展,累积了大量对话数据,使得由数据驱动的对话模型成为可能。目前的对话任务,大多仍然在生成式任务的大框架之下,而生成式任务一般都是序列到序列的。端到端的编码器-解码器模型是用于解决序列到序列任务的重要机制,对编码器-解码器模型的扩充和修改,使之应用于对话任务,是目前对话模型领域的主流做法。本文在编码器-解码器模型的基础上,提出新的修改和补充,使之应用于单轮对话和多轮对话任务。(1)对于单轮对话任务,针对一般的基于RNN的编码器-解码器模型无法很好地生成多样性和准确性回复的问题,本文提出融入顺序位置信息的增强注意力机制。经过RNN结构处理的序列信息带有顺序位置信息,同时又对序列信息进行了序列内部的注意力计算,这形成了一种增强的注意力,充分表达了序列内部丰富的信息关联,促进了多样性回复的生成。在解码时,增强注意力的计算,使得每一步生成预测时,能够按权重参照已生成序列信息,这提高了 RNN结构解码时对对话序列后端预测的准确性。接着,在Transformer的结构的基础上,针对其对顺序位置信息获取的不足,提出增加一个顺序位置信息模块,然后将模型运用于单轮对话任务。(2)对于多轮对话任务,针对多轮对话有效数据较少且模型结构过大,可能导致训练效果不好,在原有的层次循环编码器-解码器模型的基础上,提出对模型进行自编码预训练。在预训练中,利用变分自编码器的隐变量机制使得模型能够预先学习到大量普通对话内部多样的语义信息。正式训练时,虽然隐变量的加入增加了语义空间的多样性,使得在解码时有更多的随机性选择以生成多样性的回复,但是只有随机性也使得生成的回复存在随意性和信息不匹配的问题。针对这一问题,改进的模型向隐变量加入特定的背景条件信息,如主题或者目的等信息,以达到在全局随机性中增加一些局部确定性因素。这些操作使得模型能够充分获取对话数据的内部语义信息,同时生成相关性更强的内容。
其他文献
模糊图像超分辨率复原由于其实用性和可靠性,被广泛应用于军事,医疗,教育,侦察等领域,原有的模糊图像超分辨率复原方法由于技术的局限性,已经逐渐不能满足当下实际情形中图像复原质量的需求,因此研究如何提高模糊图像超分辨率复原的质量具有重要的意义。本研究在以模糊核估计算法和生成对抗网络模型为基础的传统模糊图像超分辨率复原模型上有如下创新工作:本研究提出了新的模糊核估计算法,该算法主要包括多尺寸模糊核估计,
自20世纪末物联网概念被提出并得到大力推广,无线通信技术及其应用在全球范围内再次掀起一番热潮。2.4 GHz作为通用无线工作频段,其在物联网系统中的产品开发及应用得到了快速的发展。其中,天线是无线信号收发装置的关键一环,天线性能的优劣直接决定了收发系统整体的工作能力。无线系统小型化的发展需求,将天线的小型化及信道数的拓展推向时下研究热点。可见天线小型化技术及多输入多输出(Multiple-Inpu
随着物联网技术的发展,万物互联变成现实。车联网作为物联网的一个重要分支,在安全驾驶、电子不停车收费系统(ETC)、智慧城市等方面发挥着重要的作用。为了保证上述应用的实施,越来越多的天线安装在汽车上。当天线安装在汽车上时,天线的辐射方向图将会受汽车的影响而发生变化,因此快速获取安装辐射方向图对于指导天线在汽车上的布局优化至关重要。若通过全波仿真求解天线的安装辐射方向图将会花费很长的计算时间,其次,出
会议的组织及实施在电力系统中是极为常见的事情,邮件及电话通知、纸质材料打印、手签签到表、大屏投影等传统手段依然是支持电力系统种类会议的重要手段。电力系统一直将信息化与智能化作为生产及管理中一个重要的支撑手段用来提升生产及管理的效率,因此通过一套较为便捷的会议管理系统软件来支撑电力系统的各类会议是非常必要的。本论文实现了一套基于Android平台的会议管理系统软件,从前期的需求调研到系统的设计、系统
近年来大尺寸高性能复合材料凭借优秀的性能在航空航天领域的使用比例大幅度提升,因此针对大尺寸航天复合材料缺陷的非接触无损检测技术研发具有重大意义。本文结合大尺寸复合材料原位、外场、整体缺陷的检测需求,运用红外热波成像技术对复合材料在热激励下温度场变化信息进行采集,得到红外图像序列,根据红外图像序列中的温度的变化特性与检测需求,最终实现了对大尺寸复合材料完整检测结果的呈现并实现缺陷的定量检测。在此基础
目标跟踪是一种要求定位并持续跟踪视频片段中的目标的计算机视觉任务,由于在交通、医疗、安防等多个领域存在难以替代的应用价值,自诞生以来便广泛得到研究人员的关注。经过长期发展,目前主流目标跟踪算法可划分为两类:基于相关滤波的算法和基于深度学习的算法。前者兼顾优秀的运行效率和跟踪效果,后者则得益于神经网络强大的可塑性和海量训练数据,不断取得越来越瞩目的成绩。这两类算法均存在巨大的发展空间,同时也互相取长
随着红外小目标跟踪在国防军事、民用安全领域的应用深入,航迹关联技术备受挑战。空中平台导弹发射会产生航迹分裂,导弹命中空中目标会导致航迹合并,空中飞行物近距离接触后分离会产生航迹交叉。因此,研究红外背景下的多目标航迹关联技术具有重要的现实意义。目前,现有航迹算法存在多处不足,其一,存在维度爆炸问题;其二,航迹交叉重叠时易关联错误;其三,大多数算法不适合航迹分裂、航迹合并等特殊航迹关联类型。近些年来,
随着大数据时代的到来,传统的向量或矩阵的数据表示方法已经不能满足对目标各个属性进行完整的表达的需求。张量,作为向量和矩阵在高阶空间的拓展,一经出现便引起了广泛的关注。如果张量的每一阶都代表了目标的某一种属性,那么张量就可以自然而然地将目标的各个属性进行完整地表达。然而,因其数据量会随着阶数的增加呈指数增长,如何处理庞大的张量数据又成了一个难题。张量链分解算法可以将高阶张量分解为若干低阶张量的外积,
计算机仿真软件是产品创新和工业装备的核心技术之一,不仅对工业生产产生着巨大的影响,还在军工装备的研发和国防事业中发挥着举足轻重的作用,计算机仿真软件的发展水平可以反映一个国家的工业技术水平。针对电子科技大学计算机仿真技术实验室开发的有着自主知识产权的微波器件仿真软件MTSS后处理模块不够完善没有动画效果,不能直观展示模型的运动状态,不能实时观察正在仿真运行与仿真分析后模型的相应属性的动态变化规律问
糖尿病视网膜病变(diabetic retinopathy,DR)是糖尿病最主要的并发症之一,在早期发现DR并对其进行针对性治疗,对保护患者的视力极为重要。本文基于彩色眼底图像与荧光造影图像,对眼底图像的各类生理结构的分割与多类型DR病变的检测进行了研究。实现病变的检测后,依据图像中出现病变的类型对DR进行分级,实现了高性能的DR病变检测与分级辅助诊断系统,主要研究内容如下。(1)采用了一种基于形