基于主题强化和语义一致的对话生成技术研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:rscgmy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话,主要目标就是希望机器能够与人类进行流畅、自然的对话,从而便利人类的生活,满足人类的需求。为了增强对话质量,使机器生成的语句更像人类发出,涌现出了各种各样的人机对话系统。但是,在开放域中,如何能让机器清楚理解人类意图,明确对话目标,仍是一直在攻克的难关。因此,本文主要关注在开放域中的对话生成,该任务旨在生成更符合逻辑,与上下文衔接更紧密,更具有主题性和多样性的回复内容。本文的主要工作如下:(1)基于显式主题增强的单轮对话生成技术研究。现有的一些对话生成方法虽然都关注到了主题相关性,但是在开放域中进行对话,涉及到的话题广泛,如何能使答复内容与源句在主题上高度相关仍是研究人员一直在探索和解决的难题。在开放域中,现有的对话系统在生成句子时对主题的关注不够充分,从文本中提取的主题词序列在加入模型时不注意对信息的筛选,极易造成较大的语义误差。针对该问题,本文构建了基于显式主题增强的单轮对话生成模型。对话过程中通过多种方式探索合适的词向量,着重考虑两个句子之间语义信息和主题信息的一致性,致力于生成语义连贯主题一致的高质量对话内容。本章对该模型做了一系列对比实验,结果证明,该模型在生成对话的质量上有一定程度的提高。(2)基于信息交互和话题扩展的多轮对话生成技术研究。在提高了单轮对话质量的前提下,我们着眼于对多轮对话的研究。现有的多轮对话,虽然会注意到回复内容与上下文之间的衔接问题,但是却忽略了对主题的扩展,导致会倾向于生成“嗯嗯,好的”、“我知道了”、“好吧好吧”之类结束话题的句子,并不适用于日常的闲聊对话。针对该类问题,本文提出了一个基于信息交互和话题扩展的多轮对话生成模型,该模型构建了回复内容和上下文之间的信息交互,保证了回复内容与上下文之间的语义一致,设计了话题扩展模块,用于在对话过程中的话题扩展,使得人机交流能够持续进行,同时还利用CVAE的思想,构造新的先验网络和推理网络,提高了回复内容的多样性。另外,我们让模型对任意位置上的内容进行生成,并还需和上下文能够衔接,进一步加强了模型的理解能力,最终,在LCCC数据集上进行了实验,实验结果表明,该模型具有一定的优越性。
其他文献
目前,知识图谱已广泛应用于各个领域,在教育领域的应用和成就尤为显著,知识图谱在教育教学中扮演着越来越重要的角色。编程学习作为教育领域的一个重要分支,对于初学者来说,却仍存在诸多挑战,如学习周期普遍较长、缺乏有效的学习辅助手段并且在编程实践中难以及时的获得帮助等。这些挑战给编程初学者带来极大的不便,对于其知识的掌握和能力的提升都是不利的。基于上述内容,本文在分析编程语言学科特点的基础上,围绕着编程语
计算机信息技术发展日新月异,其开发应用百花齐放,深入各行各业。计算机视觉技术对图像和视频的处理水平也日趋成熟,尤其是人脸检测和识别技术发展迅猛,在人机交互、身份验证和视频安防等领域均有一定的研究成果。卷积神经网络是深度学习的代表算法,因其良好的鲁棒性和较高的准确率,广泛应用在目标检测和模式识别领域,逐渐成为工程应用的主流选择。人机交互技术使人与机器建立连接,实现机器为人提供更加优质的服务。这些技术
伴随着互联网的发展和普及,以MOOC为代表的在线学习已成为一种新型的学习方式。在新冠肺炎疫情期间实施的“停课不停学”活动,进一步推动了 MOOC学习的应用广度和深度。虽然MOOC学习具有不受时间空间限制、受众门槛低、学习资源丰富等优势,但也存在学习者被淹没在海量的资源中、难以找到符合自身需求的学习资源以及退课率高等诸多问题,所以如何为在线学习者提供个性化的资源服务是当前在线学习领域亟需解决的问题。
从工程领域到经济学领域,大量问题都存在多个需要优化的目标,而且各个目标之间相互制约、彼此冲突,此类问题被称为多目标优化问题(Multiobjective Optimization Problem,MOP)。与传统数学方法相比,进化多目标优化算法(Evolutionary Multiobjective Optimization Algorithm,EMOA)不需要了解问题的数学特性,而且在一次运行中
随着“互联网+”教育和智能技术的不断融合,智慧课堂场景下的多屏多点触控教学模式应运而生,教学内容及教学活动表现形式将更加丰富多彩。然而,以教师为主体的填鸭式教学模式将不适用于新时代背景下的师生互动关系,不利于教学效果的提升。为引导学生成为教学活动中的主体,掌握教学过程中的学生学习状态、感兴趣情况是非常有必要的。课堂学生注意力将能够客观真实地反映教学活动中学生的兴趣热点、知识盲区以及积极状态,是提高
单细胞RNA测序(scRNA-seq)技术是研究基因与表型之间的关系的利器,同时也是当前生物医学研究中最重要的技术之一。然而多种因素导致单细胞RNA测序数据中存在噪声,如Dropout现象等。这些噪声可能会阻碍单细胞测序的部分下游分析问题。为此研究人员提出多种计算方法用以填充或补全单细胞测序数据,以减少数据噪声。单细胞RNA测序数据会因为Dropout现象等原因导致测序数据矩阵具有极高的稀疏性,针
随着我国大学入学人数的逐年递增,高校教学质量受到了社会各界人士的广泛关注;而学业成绩作为衡量学生一段时间学习成效的重要指标,成为评价高校教育水准的重要指标之一。同时,各高校借着物联网、云计算和大数据迅猛发展的东风,纷纷建立了数字化校园环境。在此进程中,海量学生行为数据在校园内生成并不断积累。这些数据涵盖了学生日常学习和生活的全过程,不仅是研究人员当下关注的重点,也受到了高校管理人员的关注。但在实际
《:塑料成型工艺与模具设计》是模具与机电相关专业的必修课程,其课程思政教学改革是专业建设的重要内容,也是人才培养的重要环节,针对该课程内容庞杂、系统性和实践性强的特点,通过发掘课程蕴涵的“思政元素”,对《塑料成型工艺与模具设计》的课程思政教学进行有益的探索,并取得较好的教学效果。
《1000以内数的认识》是学生在认识了100以内数的基础上教学的,旨在认识"千位"及其计数单位——"千",初步建立四位数的整数数位顺序,进一步体会相邻单位之间的十进制关系,并在此过程中有意识地培养学生的数感。这是教材第一次正式介绍"比100大的数",对于二年级学生来说,在生活中其实已普遍接触过,且绝大多数学生会读会写即将要学的"1000以内的数"。在这样的学情下,加之"数的认识"本身又有些枯
期刊
互联网的飞速发展,既孕育着机遇,又带来了挑战。一方面,许多网络社交媒介涌入人们的生活,如微信、微博、贴吧等,使得人们在发表自己的言论时不受时间空间的限制,互联网俨然成为了人们思想文化信息的集散地。另一方面,正是由于人们在互联网上发表的言论存在自由性强、受众面广、传播速度快和超越时空性等特点,为虚假违法消息的传播提供途径,容易导致舆情负面危机,互联网因此成为社会舆论的放大器。因此,如何用科学的方法预