面向开放域的对话系统评估算法研究与设计

来源 :深圳大学 | 被引量 : 1次 | 上传用户:vito23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话系统是自然语言处理领域一个重要的研究课题。越来越多的服务商使用智能对话系统来帮助他们减少人工开销。同时,也有越来越多的用户愿意使用智能对话助理来帮助他们完成日常的各项工作。特别是近年来,随着深度学习等技术的发展,面向开放域的对话系统逐渐成为了研究热点。为了设计更好的对话系统,对系统生成的应答进行质量评估,是研究过程中不可或缺的一步。一个好的评估方法,将有助于缩小机器对话与人类之间的差距。然而,在面向开放域的对话系统中,自动化评估一直是一个悬而未决的问题。相关研究表明,该领域现有的评估方法与人类主观评估相关性较低。这些方法无法评估对话系统是否生成了内容相关的、信息丰富的对话。为了应对这一挑战,本文设计了一个面向信息的对话评估框架来模拟人类的主观评估过程。同时,我们基于该框架,设计了一个基于启发式规则和一个基于深度学习的对话评估模型。基于启发式规则的模型通过句子的依存语法关系,来快速提取对话中存在的主要信息。同时,该模型利用预训练的词嵌入模块来获取信息三元组的向量表示,并通过一个贪婪算法计算出最终的匹配分数。在Reddit和Weibo数据库的实验中,基于启发式规则的模型能够提高开放域对话系统的质量,同时能够正确地区分出不同对话模型性能的差异。另外,基于深度学习的模型利用Bi-LSTM和自注意力机制设计了一个多三元组提取的网络模型。该模型相比启发式规则的模型能够提取对话中更多的信息。同时,这些三元组序列将通过一个基于多三元组和惩罚机制的匹配算法,来得到更为准确的评估分数。在Twitter和Weibo数据库的实验中,该模型同样能够提高开放域对话系统的质量并且能正确区分出不同对话系统的性能差异。在与人类主观评估的相关性实验中,该模型比起主流的评估算法取得了更高的相关性。
其他文献
低频、可靠的预测买入或卖出的关键交易事件,是实现金融交易高回报、低风险的有效途径。金融序列的过去值对未来值有直接或者间接的影响,这导致了关键交易事件具有上下文依赖性,交易关键点在相对应的上下文子序列中才有意义。本文首先从价格相对强弱指数RSI和交易量相对强弱指数RSI中提取不同特征组成辅助序列R。根据辅助序列R,定义了圆弧底形态RB和圆弧顶形态RT上下文子序列和其中的关键交易点,并设计相应分割算法
硒是一种生命必须的微量元素,与多种生理过程及重大疾病有关。硒蛋白是硒在体内的主要作用形式。使用生物信息学方法对硒蛋白及其相关合成基因进行识别是硒蛋白研究的一个重要方向。近年来,伴随着生物信息学的快速发展以及大规模物种基因组测序的完成,硒蛋白的研究工作取得了重大进展。但人们对于真核生物硒蛋白的认识还非常片面,仅仅局限于某些特定分区中。而且对硒蛋白的功能和合成机制的认识还不清晰。本论文首先建立了硒蛋白
21世纪以来,随着通信技术和信息产业的持续高速发展,各种通信方式不断出现并迅速得到广泛的应用,数字信息的存储和交换量与日俱增,也使人们生活的各个方面都变得十分便利.我们知道数字信号在无线或有线发射的过程中,有时会受到外界的干扰,因此在接收端往往会产生误码.纠错编码即信道编码是现代编码理论之一,主要为了研究如何克服外界的干扰,提高信息传播的准确性,改善通信的质量,使通信系统具有自动检错和纠错的能力.
流感作为一种具有季节性和高度传染性严重危害人类社会安全的大型流行性疾病,对于流感特别是禽流感的防控显得非常重要。禽流感病毒作为一种导致人患高致病性禽流感的病原体,侵染人体后会产生于普通流感相似的发热、腹泻、肌肉酸痛等症状。与通常的人流感病毒导致的季节性流感不同,禽流感病毒在经过基因重组后获得跨物种侵染能力,且人体对此类病毒亚型没有初步免疫能力,因此当人体初次接触到禽流感病毒后,会引发比普通流感更严
随着人们生活水平日益提高,生理机能健康越来越受到大众的关注,生理功能下降已被认为是引发人体各种疾病的主要诱因。如果不采取适当和必要的措施,生理机能下降将导致更多的并发症。生理机能评估是对人体各部分机体能力做出科学合理的评价,是预防生理机能病变、保障人体健康的重要步骤。目前生理机能的评估需要在专业人员的全力配合下进行,这样带来大量人力时间成本。针对此类问题,本文观察到将基于深度信息的人体活动分析与评
溴酸盐是含溴化物的水在进行臭氧消毒过程中形成的副产物,国际癌症研究机构(IARC)将其列为潜在的致癌物。溴酸盐的去除方法包括物理法、化学法和生物法。其中生物法通过微生物自身代谢作用在以有机物等作为电子供体条件下将溴酸盐还原为无毒的溴离子。该方法具有低能耗、无二次污染等优点,应用前景广阔。然而,在微生物还原溴酸盐的研究中,溴酸盐还原功能菌群的多样性尚不明确,溴酸盐还原功能基因和代谢机理尚未明晰,溴酸
目前全球大约有2.85亿视力障碍人士,他们因失去视觉这一重要信息源而渐渐被社会边缘化。通过将视觉图像处理技术应用到盲人辅助系统中帮助他们更好地从周围环境获取信息,具有较大的工程意义和社会意义。随着深度学习的发展,以卷积神经网络为基础的目标检测算法开始应用到盲人视觉辅助系统中,其在识别率和鲁棒性上都优于传统图像处理技术。然而,因为卷积神经网络运算中包含大量乘加计算与频繁的数据读写,导致算法移植到资源
蛋白的氧化还原是普遍存在于生物体内的一种化学反应,可由物理、化学和生物因素诱导产生。生理水平的活性氧簇(Reactive oxygen species,ROS)对细胞增殖和生长有积极的调节作用,但如果超过某一阈值,将会严重损害DNA、蛋白质、脂质等生物大分子,造成细胞功能丧失甚至不可逆损伤。含硫氨基酸甲硫氨酸(Methionine,Met)是最易被氧化的氨基酸之一,氧化后的甲硫氨酸形成两种差向异构
既有研究表明保障性住区存在特定人群特征与居住需求,其户外公共空间存在供给与需求不匹配的问题,包括户外空间景观化、功能与设施配给不足、人均活动场地面积偏小等问题。这些问题一定程度上影响了居民的居民生活质量和居住满意度。本研究以保障性住区内的户外公共空间为研究对象,聚焦于居民时空间行为与户外空间关系,围绕着如何提升保障性住区户外空间供给与需求的问题展开。研究在对深圳保障性住房项目进行普查式调研的基础上
空间RDF数据上的Top k最相关语义地点检索查询结合了基于关键词检索和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由kSP(Top k Sematic Place)算法查