【摘 要】
:
在自然语言处理中,人机对话系统主要关注如何给真人说的一句话作出合理的回应,这涉及到文本、语音、图形等方面的专业计算机科学知识。传统的对话系统大多数是基于某个领域的
论文部分内容阅读
在自然语言处理中,人机对话系统主要关注如何给真人说的一句话作出合理的回应,这涉及到文本、语音、图形等方面的专业计算机科学知识。传统的对话系统大多数是基于某个领域的,有着固定的架构以及实现理论,虽然部分已经实现了商用,但是需要大量的人工来收集知识库并且设计对话规则,耗时、不灵活并且领域局限性太强。现有的少量的领域开放型对话系统的实现方法纷乱纷杂,没有标准的实现方法,并且大多数效果很差。而本研究另辟蹊径,尝试研究如何给出一条微博的合理自动回复,运用统计学方法去学习对话特征,致力于实现一个没有领域限制的人机对话系统。本文主要提出了一种基于短语的统计机器翻译的回应自动产生方法,其目的是从推特状态——回应平行语料中获取英语对话特征。我们把回应推特状态的过程规范化到一个单语机器翻译过程,该过程分为两个阶段。第一个阶段是提炼语料,主要是运用对齐模型将每一个状态——回应对中的未对齐部分移除,保留已经很好的对齐部分;第二个阶段是自动回应系统实现,运用统计机器翻译,在提炼过的语料上训练翻译模型。给出一个新的推特状态,该翻译模型能自动生成回应。此外,为了能够泛化该翻译模型,我们将原始的状态——回应平行语料进行命名实体标注,并重新执行以上两个阶段。作为比较,我们另外实现了另外两种领域开放型对话系统,即基于向量空间搜索以及零知识自学习的对话系统,数据分别来自微博论坛以及电影剧本。我们运用人工方式来评测回应的流畅度以及合理度,并同时给出翻译模型的BLEU分数。
其他文献
自然语言处理是计算机科学与语言学的交叉学科,主要研究的是计算机怎么处理和分析自然语言。情感分析(Sentiment Analysis,SA)是一个知识领域,它涉及人们对特定实体的意见、
空间调制(Spatial Modulation,SM)技术是继多输入多输出(MIMO)技术之后而出现的一种新兴的调制技术,该方案利用在通信系统的收发两端同时配置多根天线,通过在每一发送时隙只
数学概念是数学学习的基础,是帮助学生去分析数学问题,进行数学思维运用,最终达到解决数学问题的目的。数学定义的理解在数学学习过程中相对较难,但是理解定义对于数学的学习来说又是至关重要的第一步,数学定义的讲解是在教学时运用一些手段和方法引入所要学习的概念,以便于学生可以更好地理解概念,概念引入环节在一堂课的整个学习过程中起到了奠定基础的作用。概念引入的形式与教学方法和学生的学习效率有着密不可分的联系。
目的:本研究将收集与整理近年来与中医药联合常规西药治疗冠心病支架术后相关的临床研究结果,对中西医联合治疗冠心病支架术后的疗效进行系统评价。同时运用数据挖掘技术对所
研究目的:分析剖宫产瘢痕妊娠患者初次治疗失败的高危因素,进而为临床诊疗提供参考依据。材料与方法:收集2009年1月至2019年9月就诊于浙江大学医学院附属妇产科医院的剖宫产
近年来,太赫兹科学技术因其特有的魅力在国际上受到广泛的关注,针对太赫兹波源的研究是一个热点方向。基于自由电子受激辐射原理的回旋管因克服了高频结构尺寸与工作波长的共度性,成为了最有可能输出大功率太赫兹波的器件,得到了蓬勃发展。本文中所研究的双阳极磁控注入电子枪,是为0.65 THz二次谐波回旋管提供发射电子的源,因回旋管高频腔截止半径仅1.3 mm,要求的电子注平均引导中心半径为1 mm,回旋管对电
背景与目的:肾细胞癌(renal cell carcinoma,Rcc),是肾实质恶性肿瘤最常见类型之一,肾小管上皮细胞为其细胞来源。肾癌病因复杂,目前已知的有吸烟、药物、病毒及重金属镉等,
糖尿病是常见的内分泌代谢疾病,以胰岛β细胞合成和分泌的胰岛素绝对或相对不足为主要特征,并伴随血糖异常升高,蛋白质代谢和脂肪代谢紊乱。全世界范围内,糖尿病已成为威胁人
近年来,随着大数据、云计算、搜索引擎等在线服务应用的兴起,数据中心网络所承载的流量呈现指数式的增长态势。综合了光电路交换与光分组交换两者优点的混合光交换技术,不仅
设备到设备(Device-to-Device,D2D)通信是无线通信网络中的一个重要技术,蜂窝网络中引入D2D通信技术能够提高频谱利用率、系统吞吐量等系统性能。当D2D用户和蜂窝用户共享频