开放域对话系统的个性化回复生成方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:baby_say
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话系统作为人工智能领域一个非常重要的研究子领域,也是人机交互领域中具有挑战性的一项重要任务。开放域的对话系统以闲聊的形式与用户进行不限定目的、不限定话题、不限定领域的交流,能为用户提供更自然化、人性化的人机交互体验,成为近年来众多研究者广泛关注的研究课题。目前以序列到序列模型为基础的开放域对话生成系统已经在对话生成任务取得了长足的进步,但是这类模型仍然存在容易生成琐碎且通用的回复、对话内容缺乏一致的人物个性的问题。为了解决这类问题,个性化对话系统被研究者们发掘并被证明对于实现自然真实的对话系统至关重要。个性化对话系统的目标是让机器人利用预设的个性化信息,生成既符合人物个性,又与上下文语境保持一致的高质量的回复。然而,现有的个性化对话生成模型在复杂对话场景下的表现仍然存在一些缺陷,现有工作主要存在以下两点不足:1)个性选择的准确率较低,生成回复中的个性特征不符合当前对话语境;2)个性化信息利用不充分,难以生成个性化信息丰富的回复。基于上述问题,本文以提高个性选择的准确性和充分利用个性为切入点,对开放域对话系统的个性化回复生成方法进行研究,主要研究内容包括:(1)提出基于语境增强的个性化回复生成方法。首先通过提取上下文中与对话主题和个性相关的关键信息对上下文的语义特征进行增强,以提高个性选择的准确性。其次在解码阶段设计了个性化信息注意力机制促进个性化信息在回复中的生成。此外,该方法通过标注个性化文本标签给模型添加了额外的针对个性选择的交叉熵损失,进一步选择正确的个性。(2)提出个性增强的双重交替学习网络。该方法包含了两个有着不同学习目标的对话生成子网络,其中一个子网络学习选择合适的个性,并确保生成的回复与上下文语义的相关性,而另一个子网络学习通过减弱对话上下文中特定内容的干扰来提高生成回复时个性化信息的贡献。两个子网络共享同一个编码器—解码器骨干并且通过多任务交替训练的方式让模型分开学习个性选择和个性嵌入两种能力,从而在回复生成更合适更丰富的个性。本文在个性化对话任务的公开数据集Persona-Chat上进行了实验验证,实验结果表明与现有的对话生成模型相比,本文提出的方法可以有效地提高生成回复的多样性和个性化程度。
其他文献
空化是中高速流体工程中常见的流动现象,也是流体力学的研究要点之一。空化气泡的坍塌会对流体环境中的结构部件进行侵蚀,从而缩短这些部件的寿命并引起事故,有必要对其流动特性和侵蚀机理进行研究。本文通过超声发生器引起的超声空化来加速侵蚀过程,缩短实验周期,并结合数值模拟的方法对超声空化的侵蚀特性进行研究,同时将其应用于超疏水表面的制备,使破坏作用产生有利影响。主要内容包括以下几点:(1)研究了气泡动力学和
随着高功率激光技术的发展,激光功率越来越大、成本也越来越低,高功率激光器大范围应用于船舶、轨道交通、航空航天、核电等领域的激光焊接。由于激光焊接具有独特的焊接优势,常用于这些领域关键零部件的焊接。目前厚板激光单道焊接工艺常存在表面凹陷、背部驼峰以及滴落等焊缝成形缺陷。由于一些重大工程项目对厚板激光焊接质量要求极为苛刻,只有深入研究解决上述缺陷才能获得稳定可靠的焊缝质量。基于上述背景,本文主要针对高
城市道路下,自动驾驶汽车经常会遇到复杂的动态环境,为保证决策的合理性和安全性,获得对环境中其他交通参与者行为和未来轨迹的预测至关重要。而城市道路中拥挤的交通环境和复杂的道路结构给轨迹预测带来了挑战。本文主要针对车辆这一重要的道路交通参与者,研究其在复杂场景下的轨迹预测方法。对于每个预测目标车辆,观测到的其过去的历史轨迹是推测其未来行为的关键信息之一。通过输入足够长的历史轨迹有助于模型对轨迹整体趋势
泊车过程中,驾驶员需要通过后视镜观察泊车位及周围车辆等障碍物信息,有限的观察视角不利于驾驶员充分获取周围环境信息,时常导致倒不进库或者泊车过程中与其他车辆发生剐蹭。自动泊车系统中,同样需要搜集车身四周的车道线和车位线信息,以安全顺利地控制车辆按预定路线泊入停车位。全景图像能够采集车辆四周的环境信息,包括行车线、车位线、其他车辆、行人等障碍物,可以直观地帮助驾驶员在泊车过程避开危险,顺利停车。这些信
记忆是生物体神经元的一个重要特性,忆阻器是具有记忆特性的电子元器件。学者已经证明忆阻器是模拟神经元的离子通道和神经网络的天然材料,忆阻神经网络模型是利用忆阻器来强调生物神经系统的记忆效应,相比于一般的神经网络系统,忆阻神经网络更接近于生物体实际的神经网络系统,忆阻神经网络动力学特性更能反映实际生物神经网络特定功能。生物体大脑中存在着混沌动力学行为,且混沌行为与生物体的认知功能、信息识别功能及记忆功
在多元化的保险市场竞争中,商业健康险一直承担着为我国国民的生命健康提供保障的角色,也为我国保险业高速发展贡献着力量。然而,随着生育政策的调整,在全国第七次人口普查的背景下,我国的人口结构发生了较大变化。部分学者研究发现,人口因素是影响保险需求的重要因素之一。然而结合实际情况的差异,其产生的影响会出现不同的方向和力度,因此本文在人口结构会对商业健康险的需求产生影响的基础上,聚焦于其影响的异质性结果展
随着循环经济的发展以及国六标准的出台,搅拌车行业开始进入标准化时代,重型机械轻量化的趋势不可逆转,这就要求搅拌车产品在设计初期不仅要满足客户的轻量化需求,还需要满足其具有足够疲劳寿命使用要求,这样才能提高市场份额,拥有更多的客户。本文以市场上某款搅拌车为研究对象,基于Hyperworks分析了搅拌车在通常行驶工况下的刚度状况和强度状况,基于ADAMS/Car建立四桥整车系统动力学模型,利用Desi
直流配电网不存在无功波动、谐波劣化、频率波动和同步振荡等问题,相比于交流配电网具有诸多优势,是分布式电源消纳的有效途径。直流变压器作为直流配电网的核心装备,其高效可靠运行对直流配电网具有重要意义。现有直流变压器多采用两端口拓扑结构,在直流配电网进行多电压等级能量变换时,需要配备多台两端口直流变压器。多台直流变压器共同运行不仅增加了能量转换次数和建设成本,端口间还会产生环流,导致协调控制难度大、系统
车辆队列是智能交通系统的一个研究热点。在保证安全稳定的前提下,缩短车辆队列的车间距离可以提高道路通行能力,有效缓解道路交通拥堵,降低车辆油耗。通信作为车辆队列完成信息实时交互的关键,对车辆的控制系统性能具有非常重要的影响。本文讨论了信息流拓扑结构对匀质车辆队列控制性能的影响,采用所选取的信息流拓扑结构,构建了以车辆非线性纵向动力学为基础的车辆队列模型,采用终端约束以及Lyapunov稳定性理论,设
图像压缩和图像分割算法是目前数字图像处理中应用较广泛的技术。图像压缩旨在当压缩率较高时图像信息丢失(颜色、纹理等)较少,这样可以在保证图像质量的前提下减少图像所需存储空间以及传输带宽。但目前的图像压缩技术难以协调压缩率和图像质量之间的矛盾,且往往对于不同的压缩率需要重新训练网络模型,这是极其耗时的。图像分割旨在能够精准地从图像中提取到目标物体,但传统的分割算法分割准确率较低、性能较差、耗时较久。目