基于nGram2vec与词义演化的词相似度计算方法

来源 :软件导刊 | 被引量 : 0次 | 上传用户:watersss1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词相似度计算在文本分类等自然语言处理众多任务中有广泛应用,为了提高准确率并将其应用于文本分类任务中,提出基于知网与同义词林以及基于nGram训练大规模语料相结合的方法,通过词义演化技术检测词义变化确定两种方法的权重,利用皮尔逊相关系数对比人工定义词语相似度。通过实验将该方法与基于知网和同义词林的方法进行对比,根据随时间改变而词义有无变化选取15对词语进行测试,结果表明后者比前者提高了28%。由此可以看出,基于语料与语义词典的方法明显比单纯基于语义词典的方法好,但仍有较大改进空间。
其他文献
以摩托车发动机总成为对象和载体,互联网+,虚拟现实为技术路线,开发了发动机网络虚拟仿真实验教学平台、虚拟现实实验教学平台及现场实验教学平台,建立了集网络、虚拟现实与
胡锦涛总书记在2011年庆祝中国共产党成立90周年大会的时候第一次提出了"中国特色社会主义制度"这一概念。标志着马克思主义中国化,迈入了新的台阶。而这一概念,是中国共产党在
14-3-3蛋白是植物体内重要的信号转导调节分子,在碳代谢、逆境胁迫响应、生长发育等过程中发挥重要调控作用。为了深入解析14-3-3蛋白家族在木薯中的生物学功能,该研究采用酶
目的:探讨进展性卒中的临床特点、病因及意义。方法:将发病24h内人院治疗的450例脑梗死进行分组,分成进展组和非进展组,分析进展性卒中患者的临床表现,并将其梗死部位、发热、血压
2016年9月,长安之星5单双排高端货车成功上市,完善了货车谱系,满足市场对高端货车的需求。MD/S201仓栅车(改进型)顺利完成开发及法规认证,目前已完成56台份试生产。同时,新品
随着高校的不断扩招,大学生的就业能力越来越受到社会的关注,不管是企业、高校还是学生都在时刻关注着就业能力这一热点。通过对企业的调查,我们发现在企业需求视角下大学生
总结了钢混结合段在斜拉桥中的应用特点,从而提出依据钢混结合段受力形式,明确其传力机理和过程,给出针对性构造对策的设计思路。最后,建立了钢混结合段的一般设计过程和方法,可应
目的探讨低分子肝素钙联合尿激酶在进展性脑梗死患者治疗中的疗效。方法选择本院100例进展性脑梗死患者,上述患者随机分为观察组和对照组,观察组和对照组均给予常规治疗,观察
目的分析评定高效液相色谱法测定水产品中甲醛含量的测量不确定度,评价该方法检测结果的准确性,提高检测的质量评价与质量控制水平。方法按照《化学分析测量不确定度评定》技
<正>~~