基于不确定性理论的单词语义相似度度量

来源 :吉林大学 | 被引量 : 0次 | 上传用户:wankunbaobao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基于语料库的方法通常受制于所采用的语料库从而难以避免数据稀疏问题,而基于知识的方法虽然简单有效不使用语料库进行训练但多受人的主观意识影响。本文意图探索即简单有效又无需受制于大规模语料库的单词语义相似度度量方法。结合语言的不精确性,本文基于朴素贝叶斯模型、主观Bayes方法、证据理论、确定因子、云模型和模糊集对单词语义相似度进行建模,探讨不确定性理论用于单词语义相似度度量的可行性。利用人工标注样本集采用云模型和模糊集建模部分群体依据单个特征判定语义相似度,然后再将证据合成量化单词语义相似度;并分析了特征模糊化对单词语义相似度的影响。在数据集R&G(65)上,对比算法评判结果与人类评判结果的相关度,其样本Pearson相关系数均高于0.91,比当前最优方法高出至少0.4个百分点,比经典算法高出7~13个百分点;Spearman相关系数均高于0.86,比经典算法高出9~19个百分点。在数据集M&C(30)和WordSim353上也取得了比较好的实验结果。同时本文所提方法的执行效率和经典算法相当。实验结果显示使用不确定性理论量化单词语义相似度是合理有效的,其中利用云模型建模单词语义相似度效果最佳。
其他文献
目的了解医学生与非医学生在艾滋病(AIDS)知识、态度、行为和知识获取方面的基本情况及差异,为高校制订合理的健康教育策略提供相关依据。方法运用AIDS知识、态度、行为、知
目的:了解患者输血前相关传染病的感染情况。方法采用ELISA对该院7827例拟输血的患者进行乙型肝炎表面抗原(HBsAg)、丙型肝炎抗体(抗-HCV)、人类免疫缺陷病毒抗体(抗-HIV)和梅毒螺旋
期刊
博物馆作为研究、展示、宣传人类文化的文化基地,具有非常强的文化属性与公共服务属性,在我国的公共文化服务体系以及国民教育体系当中都占据着非常重要的地位。本文基于作者自
人们常说,语文是炫目的繁星,是皎洁的明月,是珠落玉盘的琵琶,是千古绝唱的诗词曲赋,是功垂青史的经史子集……。面对如此意蕴深厚、丰富多彩的语文,我们语文教学除了要抓住“诗意”
目的:探讨慢性化脓性中耳炎(CSOM )患者在乳突切除手术前、后菌群的动态变化特点。方法收集86例CSOM患者手术前、后的分泌物或组织进行细菌培养和药敏试验,对胆脂瘤组和非胆脂瘤
目的:通过高脂饲料诱发的SD大鼠肥胖模型研究肥胖对慢性前列腺炎(CP)发病的影响及其相关机制。方法实验分为普通饲料组、高脂饲料组、阳性对照组。通过喂养高脂饲料建立大鼠肥胖
本文主要研究方向和内容是拉赫玛尼诺夫《音画练习曲》op.33中经作曲家同意而被出版的六首,主要研究其音乐的创作分析与演奏的技术性的探讨。全文分为四个章节,第一章节为绪论部分,介绍此研究课题的背景、现状以及研究的意义,一共分为四节,第一节介绍研究背景及意义,第二节和第三节主要是介绍该课题的国内外研究内容与运用的研究方法,第四节说明了文章的创新之处,以及重点和难点部分。第二章是背景的介绍,总共有两节,
农业生态经济系统的物质循环是建立循环农业的理论基础,生态农业是建立农业循环经济体系的有效途径.我们可以通过加强农业循环经济的宣传力度、强化政府对农业循环经济的引导
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield