Word2vec模型在聊天机器人中的应用研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:huihuiwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,聊天机器人在越来越多的领域有了应用,但在实际应用中还有一些障碍需要克服,比如对用户的问句难以有准确的回答。Word2vec模型在情感分析、机器翻译等领域的应用中有良好的表现,文章通过将其应用到聊天机器人问句分类和相似度计算中并进行改进,以得到更好的问句分类和相似度计算效果,提升用户体验。Word2vec模型通过训练词向量,将词向量进行组合得到文档向量进行文本表示,具有良好语义表达效果。本文将在此基础上进行改进得到组合的文本表示方法,它通过将词性贡献因子和TF-IDF结合作为权重,对Word2vec词向量进行加权求得句子向量与LDA主题模型训练出的句子向量拼接进行文本表示,并且以Word2vec词向量为基础提出计算问句间的相似度的算法。利用聊天机器人对话语料中的问句进行实证研究得出如下结论:较其他三种常用的文本表示,基于Word2vec模型的组合文本表示在KNN、NB、SVM三种分类器的问句分类结果中F1值均有提升,达到了较好的问句分类效果;在问句相似度计算中,相较于编辑距离和Jaccard系数,基于Word2vec模型的相似度计算方法在测试数据中有更好的计算效果,虽在计算时间上略有弱势,但仍在可接受的合理范围内。综上可以看出,Word2vec模型训练出的词向量具有良好的语义表达效果,使得文本表示不再停留在语言表层更多的深入语义,利用此模型进行问句分类和问句相似度计算可以取得良好的效果。
其他文献
近代以来,中国开始了现代意义上的城市化/城镇化历程并持续至今。这一进程在小说上同样有所表现,随着1990年代起进城女性的增加以及关注、写作进城女性形象的作家随之增多,“
存托凭证作为金融衍生工具,因可以跨境发行融资被全球广泛运用。中国存托凭证(CDR)的提出,不仅可以服务新经济,促进资本市场国际化进程,同时可以满足投资者的多元化投资需求,促进我国资本的双向流通。但是在现行法律制度下,CDR的试点和推进还存在着法律和监管风险,需要解决存托凭证法律性质、投资者身份、发行人认定、信息不对称和管辖权冲突等问题以便于保护境内投资者的权益。构建和完善投资者保护机制首要解决的问
作为中国发展的关键问题,快速城市化发展带来日益增加的生态环境压力,随之产生了环境污染、资源过度消耗等一系列生态环境问题,而这些问题的产生反过来制约着城市化的发展。城市发展与生态环境可持续性之间的矛盾日益突出。因此,探讨城市化质量与生态环境之间的耦合协调关系,对区域未来可持续发展具有重要意义。本研究以海峡西岸城市群为研究对象,研究时段为2003—2017。首先,构建包含人口城市化、空间城市化、经济城
学位
国家形象指一国在其他国家人们心目中的综合评价和印象,主要体现在别国主流媒体的“建构”上。在社会建构论中,“环境”是国家形象建构的一项指标,而在环境问题日益全球化及备受关注的当下,作为“国家形象”分支的“国家环境形象”更与国家间的政治、经济往来密切相关,相互影响。在这个背景下,“气候变化”作为当下最热门的全球环境议题,其背后浮动国际关系、环境外交,更是权力和话语权的争夺。而当节能减排渐成全球共识,各
学位
2018年11月北京师范大学承办了第12届课例研究大会,国内外教育人士齐聚一堂探讨课例研究在教育教学上已取得的成就以及未来的发展。数学课堂教学技能是职前教师在校必须学习并具备的职业“武器”,而数学课堂导入作为课堂开始的序幕是数学课堂教学艺术重要组成部分,数学课堂导入技能是所有数学教师从理论认知和实践操作上都需要重视的一项基本技能,本研究欲将课例研究与数学职前教师的数学课堂导入技能训练有机结合,选用
为了防止内部控制,保护中小投资者利益,独立董事制度作为一项制度创新于2001年引入我国。然而,目前市场上出现了这样一种现象:独立董事在任期届满后又重新回到同一家公司任职。这种现象引起了我们的关注,激发了研究兴趣。再任独董能够像初次任职的独董一样,发挥其监督大股东的作用吗?本文拟对这一现象在理论基础上作出实证研究,以期能够指导实践。本文针对我国出现的“再任”独董这一特殊现象,以不完全契约理论和信息不
监督过失注意义务的概念由主观和客观两方面组成,一方面是指监督者不仅应当认识到自己的失职行为会提高被监督者采取不法行为的风险,而且应当认识到没有建立与完善安全管理体制会引发危害结果,另一方面是指监督者应当自己或指示他人积极采取措施督促被监督者、建立与完善安全管理体制,以避免危害结果发生的义务。监督过失注意义务的内容由结果预见义务与结果回避义务构成,监督过失结果预见义务的内容有:预判义务、考察义务、决
目的:主动脉瓣二叶式畸形(BAV)是临床上最常见的先天性心脏病,常合并主动脉瓣功能异常及主动脉病。研究发现在瓣膜功能正常的BAV患者中,BAV患者主动脉中层退化,包括弹性纤维
本研究以佛山市G区Z村为例,从法律法规、主体、公开形式和渠道、公开对象和公开效果方面对乡村信息公开工作进行现状介绍,提出研究问题是乡村信息公开工作中存在问题,结合案