同义词词林相关论文
一 引言建立一个“信息处理用现代汉语分词词表”是国家社科研究“九五”规划重大项目《信息处理用现代汉语词汇研究》之子课题 9......
概念语义相似度的测量是自然语言处理的一个重要的研究内容,它在信息检索、机器翻译、词义排歧、自动问答等领域都有广泛的应用,它......
针对不利于关键词提取质量的同义词现象、一词多义现象及文章主题难以准确全面表达等问题,提出了一种基于语义的关键词提取算法CFC......
语义相似度计算就是把词语间语言学上的信息映射为0到1之间的数值。基于知识本体的语义相似度计算方法,利用知识本体提供的信息,建......
在基于内容的推荐系统中,初始用户模板的准确性对后面的推荐精度有很大影响。因此,在系统初始时,必须从少量用户信息中准确地提取出用......
本文基于《同义词词林》的义类信息,对动宾搭配短语进行了相关考察与实验。主要从100万字的清华汉语树库(TCT973)中抽取两种类型的动......
语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的......
词语相似度计算在基于实例的机器翻译、信息检索、自动问答系统等有着广泛的应用。词语相似度的计算一般都是在基于《知网》的义原......
目前,国内外许多学者借助语义词典Word Net进行标签间语义关系挖掘方面研究,并取得了一定的进展,但却很少有专门针对中文语义词典......
本体映射是解决本体异构问题的重要途径和手段,中文知识是网络开放知识库的重要组成部分,但现有的中文本体映射系统在面对大规模本......
基于记忆的自适应语言模型虽然在一定程度上增强了语言模型对不同领域的适应性,但其假设过于简单,即认为一个在文章的前面部分出现......
提出了一种基于不同语义单元度量的句子相似度计算方法。将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义......
在互联网飞速发展的今天,海量的数据在网络上共享传输,文本中的情感倾向获取对于文本的处理有着重要作用。而词汇的褒贬倾向研究是文......
随着互联网的发展,人们接触到的信息量越来越大。为了使用户能快速找到所需要的信息,提高传统检索系统的查准率变得很重要。查询扩......
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,......
词语相似度的计算是人工智能领域的一个基础性的研究课题,它在自然语言处理,QA平台的搭建、语义消歧、文本的聚类和分类这些问题有着......
汉语中一词多义现象普遍存在,词义归纳就是对在不同语境中具有相同语义的词进行归类,本质上是一聚类问题。目前广泛采用无指导的聚......
针对传统地理信息系统(GIS)结构化或半结构化属性查询方法对查询语句输入的精度及查询范围的限制,提出了以哈尔滨工业大学《同义词......
针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法。首先构建具......
知识库的提出为当下互联网社会中日益增长的数据的存储提供了良好的解决方案。近年来,英语领域的语义知识库自动化构建工作稳步发......
提出了基于语义相似度判别用户评价倾向的方法。利用同义词词林计算词语的相似度,由词语的相似度构造二部图,通过求二部图的最大匹......
介绍Web文档聚类的应用,针对现有文档聚类算法缺乏动态更新能力、经验参数过多以及缺乏对新词的把握等不足,提出动态调整的Web文档......
提出一种改进TF-IDF结合余弦定理计算中文语句相似度方法。首先采用IKAnalyzer分词器对中文语句分词处理,提取核心关键词,然后通过......
查询扩展是优化信息查询的一种重要手段。提出了一种基于多知识库和局部反馈的查询扩展方法,该方法首先融合了领域本体与同义词词林......
在自然语言中,动词的用法主要包含3种:字面、转喻和隐喻.动词的隐喻用法在隐喻的研究中占有重要的地位.动词的隐喻计算包含两个子......
为了保证抽取信息的全面性,主题划分成了不可或缺的工作.借助同义词词林,从词语的语义角度计算文本中各个段落间的相似度,建立段落......
该文提出了一种基于路径与深度的同义词词林词语语义相似度计算方法。该方法通过两个词语义项之间的最短路径以及它们的最近公共父......
目前关联数据的研究工作主要集中在实例级别上展开,而在模式级别(Schema-Level)上的关联数据构建则易被忽视。本体映射是解决本体异......
特征选择与加权是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍。介绍了一种基于同义词词林的统计......
本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ......
该文提出了一种综合知网与同义词词林的词语语义相似度计算方法。知网部分根据义原层次结构的特征,采用了顶部平缓而底部陡峭的曲......
谓词的自动识别是浅层句法分析的重要内容。本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于......
本文针对基于词向量的词语语义相似度计算方法在多义词、非邻域词和同义词三类情况计算准确性差的问题,提出了一种基于词义向量模......
针对短文本特征稀疏导致的信息表示能力不足,提出基于同义词词林扩展的短文本分类方法.该方法首先利用同义词词林确定短文本中主干......
随着在线社交网络的快速发展,微博平台上聚集了大量的包含情感的主观句。微博情感可影响受众的观点形成,作用于商务智能、政策制定......
文本情感倾向性判别是情感分析的重要组成部分,而精确的词汇情感计算是文本情感倾向性判别的基础。基于词汇知识库的情感词倾向判别......
词语语义相似度的衡量是计算机科学中很多研究的基础工作,例如机器翻译,问答系统、智能教学、信息检索、数据挖掘等。用一个数值来......
目前,在国内外的各类测试中,简答、作文等常见的主观题形式,大多使用传统人工批改,评分质量具有很强的人为因素,且效率低下,很难做......
提出一种基于同义词词林的句子语义相似度方法,借助同义词词林来计算句子的词形相似度,使用向量距离法得到句子间的词序相似度。同......
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词......
[目的/意义]利用同义词词林,挖掘标签间的相互关系,构建标签等级结构,对标签进行规范化控制,从而提高利用标签检索的效率.[方法/过......
基于同义词词林提出一种语义空间变换算法,并将其应用于平滑BLEU中,提出一种改进的基于同义词词林的BLEUS评测方法,该方法针对候选......
因特网这一新媒体的出现,使得人类已经完全摆脱了信息贫乏的枷锁,从而进入一个信息极度丰富的社会。在目前信息爆炸的情况下,信息的来......
关键词提取是文本挖掘领域中研究的核心技术之一.针对影响关键词提取质量的一词多义现象、同义词现象、文章主题准确全面表达的难点......
词汇语义信息对命名实体间语义关系的抽取具有重要的作用。目前比较丰富的中文词汇语义资源,如《同义词词林》和《知网》,都曾被用于......
针对影响关键词提取质量的一词多义现象、同义词现象以及文章主题准确全面表达的难点,提出了一种基于语义的关键词提取算法KESELC,......