基于非槽信息和记忆位置编码的对话语义理解模型研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhanglicheng666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的浪潮推动着对话系统技术的发展,对于一个智能的对话系统来说,理解用户说话的语义信息自然成为了第一要务,然而自然语言有很大的灵活性和歧义性,想要准确地把握语义信息就必须挖掘语义的特征。本文先研究了单轮对话的语义理解,观察到非槽信息(Non-Slot Information)对单轮对话的语义理解具有重要影响。进一步地,当对话轮数变多时,非槽信息分散在对话上下文历史中,多轮对话的语义理解问题需要从对话上下文历史信息中提取有用信息,本文研究了多轮场景下的语义理解问题,使用记忆位置编码(Memory Position Encoding)和记忆门机制(Memory Gate)来解决历史对话信息利用问题,具体工作如下:首先,本文先研究了单轮对话的语义理解问题。根据非槽信息特征对于语义理解的影响提出MTNSA(Multi-Task Non-Slot Attention)模型,MTNSA模型使用外部预训练模型BERT作为语义信息的编码器,通过对非槽信息的解码,利用自注意力机制强化非槽信息来提升语义理解能力。作为一个多任务联合模型,MTNSA可以同时进行领域分类、意图识别和槽填充三个任务。最后通过实验验证了非槽信息有助于增强语义理解能力。其次,领域、意图和槽之间具有显式的约束关系,本文提出了Mask掩码方法,通过统计的方式将领域、意图和槽之间的显式约束关系表征成独热编码(One-Hot)的掩码向量,在多任务模型输出的概率分布向量上,利用Mask掩码向量来将无关项排除,再取概率分布向量上最大值对应的位置来获得标签。通过与多个经典方法的叠加实验验证了Mask掩码方法对于整句正确率具有提升效果。进一步的,当对话轮数变多时,影响当前语句识别的非槽信息分散在了历史对话上下文中,想要准确地进行槽填充和意图识别就要对历史对话中的信息进行选择提取。本文采用基于记忆网络的方法编码存储和利用历史信息,并改进传统记忆网络中记忆顺序信息丢失的问题,把记忆的位置编码引入外部记忆存储中,利用位置编码强化记忆的逻辑性,赋予不同位置的历史记忆不同的权重,利用注意力机制从位置信息强化后的记忆中通过加权求和的形式获得上下文信息向量,并通过设置记忆的门机制过滤上下文信息向量中的噪声数据。实验证明了引入位置编码和记忆门机制对上下文语义的理解具有有效性。
其他文献
自然条件下获取的户外图像很容易受到环境因素的影响,例如:雨,雾,雪,光照条件等,使得获取的户外图像质量变低,很难满足计算机视觉应用的需要。目前解决环境因素导致的图像增
近几年,随着人们对地球流体力学与大气动力学的深入研究,一系列的成果不断涌现,其中,Rossby孤立波的研究作为一类特殊的、重要的分支,具有重要的理论意义和研究价值。Rossby
无机氧化锌(ZnO)材料具有电子迁移率高、成本低廉、环境稳定性好、透明度高以及空穴阻挡特性优异等优势,因此常用于倒置有机光伏器件(OPVs)的阴极界面层(CIL)。溶胶-凝胶法是ZnO CI
认罪认罚从宽制度是指在刑事案件中,犯罪嫌疑人、被告人为了获得相对更轻的刑罚和更快的审判程序,与检察机关就起诉的罪名和事实达成共识,如实供述犯罪事实的法律制度。认罪
在海洋工程快速发展的今天,海洋管线已经广泛地应用在各个海洋资源运输工程中,石油,天然气等重要海洋资源都是通过海底管线实现向陆地传输的,所以在实际工程中,自然而然地就需要考虑运输途中管线的安全问题,因为海洋环境的复杂性,各种荷载的复合作用以及本身环境相对于陆地的特殊性,都十分容易造成海底管线在这一过程中发生失稳的现象,在过往几十年的实践运用历史中,已有相当一部分事故是由于海底管线在复杂环境中破坏失效
软件定义网络作为未来网络的一种典型范例,实现了转发功能与控制功能的分离,通过提供开放的编程接口有效地解决了传统网络因功能和应用不断扩展所导致的网络结构复杂化的问题
文本聚类分析是数据挖掘领域在文本处理方向的重要研究问题。由于无监督的聚类方法可以识别社交媒体文本信息中的潜在的主题类别,发掘未知的价值领域,并能保持在海量规模数据
越来越多的人使用移动设备来记录、管理和可视化自己的日常生活数据。目前,相关研究多关注于定量统计数据的可视化来为用户提供自我监控,设计策略也多立足于如何通过引入用户
细胞分离在生物化学分析和临床医学等领域具有重要作用。相比于传统的离心、过滤、流式细胞术等方法,介电泳(DEP)细胞分离以其免标记、耗样少、易于集成等优势而受到广大研究
摆动式SMA活齿传动系统是一种集SMA传感、控制、驱动与活齿传动功能于一体的高度集成微型机电系统。通过感知复杂环境温度变化或通过精准温度控制来实现定量的输出转矩。与传统电机相比具有结构简单、低速大转矩和易于微型化等优点,特别适于微型机器人、医疗器械以及卫星探测器等尖端技术领域,具有广阔的应用前景。本文通过对摆动式SMA活齿传动系统的工作原理进行分析,建立了SMA丝相变驱动与活齿传动的耦合力学模型,