【摘 要】
:
词语相似度计算是自然语言处理的基础性工作,可以应用于信息检索、机器翻译、知识获取等任务。本文结合汉语特点,提出融合词典、词向量、汉字、部首等多源知识的词语相似度计
论文部分内容阅读
词语相似度计算是自然语言处理的基础性工作,可以应用于信息检索、机器翻译、知识获取等任务。本文结合汉语特点,提出融合词典、词向量、汉字、部首等多源知识的词语相似度计算方法,探讨了词语相似性与相关性之间的区别,以构建更为合理的词语相似度计算评测数据集,最后将词语相似度计算应用于语义选择限制知识获取。具体内容如下:(1)基于多源知识的词语相似度计算。提出基于同义词词林、词向量、汉字和部首的词语相似度计算方法,并以线性组合的方式进行融合。实验结果表明,融合方法的结果优于单一方法,在NLPCC-ICCPOL 2016词语相似度计算评测数据集(PKU-500)上的结果超过了第二名。(2)区分词语相似性与相关性。对中英文词语相似度计算主流评测数据集进行了分析,区分出了相似词对与相关词对,以相似词对为基础,构建了更加精准的词语相似度计算评测数据集,使得对词语相似度计算结果的评价更加准确。(3)基于词语相似度的语义选择限制知识获取。借助未知论元与种子论元之间的词语相似度进行论元扩展,从而得到谓词对论元的选择倾向。比较了基于词向量的词语相似度计算方法与基于词典的词语相似度计算方法在选择限制知识获取任务中的表现。实验结果表明,前者效果更好,且二者有一定的互补性,可以结合使用。与语义选择限制知识获取的其他方法相比,基于词语相似度的方法,种子选取灵活,不要求对语料进行深层句法语义分析,在伪消歧实验中也取得了较高的正确率,具有一定的优势。
其他文献
自然场景图像中包含着大量的文本信息,将其中的文本信息识别出来对于视频、图像和图片等大量信息的检索管理具有重要意义。但是在自然场景文本识别中往往面临着图像模糊不清
在大数据时代来临的当下,电子信息技术的发展速度对产品及生产流程的可靠性、实时性等多方性能提出了更高层次的要求。模拟电路在电路组成中占比虽小,但基于维修成本方面的考
微电子产业以及储能产业的发展需要介电常数高、损耗低、耐压高的介电材料。业已发现,BTFN(BaTi0.5(Fe0.5Nb0.5)O3)材料具有较高的介电常数,但介电损耗偏高、导致耐压和储能
虚拟机动态迁移技术是虚拟化的关键技术之一,利用虚拟机动态迁移技术可以实现负载均衡、系统容错、在线维护以及能耗管理等功能。目前主流的虚拟机动态迁移算法有Pre-Copy和P
生态系统服务作为耦合自然环境和人类福祉的重要桥梁和纽带,对于自然资源的合理配置与利用具有重要意义。生态系统能提供多重的生态系统服务,并且不同服务间关系复杂,表现为此消彼长的权衡关系与相互增益的协同关系。人类往往在利益和内心真实需求的驱动下,面临生态系统服务供给选择上的取舍,有意或无意地削弱其他类型生态系统服务的供给。同时,生态系统服务供给能力的下降,也会加剧区域生态系统服务供需矛盾,进而影响区域可
研究目的:探究有氧联合抗阻运动对中度智力障碍青少年健康体适能的影响。研究方法:选取29名中度智力障碍青少年,采用随机数字表法将受试者分为干预组和对照组。在11周内,干预组进行有氧联合抗阻运动(n=16),对照组不参与有氧联合抗阻运动,保持原有活动(n=13)。运动干预方案:每周4次训练课;40分钟/次的有氧联合抗阻运动干预。实验前后对参与实验的受试者的身体成分、肌肉适能、心肺耐力和柔韧适能指标进行
自从2001年二硼化镁的超导电性被发现以来,多能隙超导电性研究日益受到人们的重视。尤其是近年来各种新型铁基超导体所展现的多能隙结构以及高临界温度特征,更是进一步带动了多带超导电性的研究热潮。本论文首先基于两带Ginzburg-Landau理论,研究具有微桥结构的两带超导环在外加温度梯度下所产生的温差效应。我们利用环中sine-Gordon方程满足的孤立子解以及两带超导微桥中的Josephson电流
随着全球城市品牌及历史建筑类文化创意产业的开发,历史建筑保护与旅游业发展逐渐成为重要的议题。实地旅游体验历史建筑的方式使游览者能直观的理解城市历史和体验历史建筑,因此也会促进游览者对文创产品的购买。人们的历史情怀一部分体现在了文创产品的购买,文创产品开发形式也随着人们渐高的精神及物质要求日渐丰富。武汉市现存许多优秀的历史建筑,中山大道历史建筑群最为典型。因为独特的历史条件与地域特征,中山大道历史建
刑事被害人在我国刑事诉讼程序中有着当事人的主体地位,并且享有诸多诉讼权利,其中包括聘请代理人、发表陈述等的权利,共同组成了被害人在刑事诉讼中基本权利的重要保障。在我国,刑事诉讼是一项以国家公权机关为控诉代表,追究犯罪嫌疑人、被告人犯罪行为的诉讼程序,后者在刑事诉讼中处于非常不利的地位,因此各种诉论程序的设立都旨在保障犯罪嫌疑人、被告人的权利,往往忽视了作为受到犯罪行为侵害对象的被害人的地位及其意愿
选择性催化还原法(Selective Catalytic Reduction,SCR)以其具有高活性、高脱硝效率等优点被而广泛应用于燃煤电厂中。催化剂是整个SCR脱硝技术的核心,其脱硝性能易受飞灰中各