中文词语语义相似度计算——基于《知网》2000

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wanxueguan55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词语语义相似度的计算,一种比较常用的方法是使用分类体系的语义词典(如Wordnet)。本文首先利用Hownet中“义原”的树状层次结构,得到“义原”的相似度,再通过“义原”的相似度得到词语(“概念”)的相似度。本文通过引入事物信息量的思想,提出了自己的观点:认为知网中的“义原”对“概念”描述的作用大小取决于其本身所含的语义信息量;“义原”对“概念”的描述划分为直接描述和间接描述两类,并据此计算中文词语语义相似度,在一定程度上得到了和人的直观更加符合的结果。
其他文献
背景异基因造血干细胞移植(Allogeneic hematopoietic stem cell transplantation,allo-HSCT)是目前治愈急性髓系白血病(Acute myeloid leukemia,AML)的重要甚至唯一手段,疾病复发是导致移植失败和患者死亡的最主要原因之一。早期预测移植后复发并采取针对性干预措施,可显著降低疾病复发率(relapse rate,RR)、提高总
根据迪博内部控制与风险管理数据库资料显示,我国上市公司内控水平整体上逐年向好,但仍有60%的公司评级集中在B级,尤其是中小板、创业板上市公司内部控制规范建设急需加强。
以CRH5型动车组轮轴为研究对象,研究了夹杂物的形态对轮辋局部应力和轮辋裂纹成核的影响。结果显示,夹杂物棱角角度越小,夹杂物周围应力水平越高;夹杂物的厚度越小,半径越大,夹杂物
用气相色谱-质谱联用法分析了广东合欢花挥发油的化学成分,并测定了各成分的相对百分含量。共鉴定了35个化学成分,占总挥发油的87.14%。其中橙花叔醇占51.69%,是挥发油的主要成分。
国家自然科学基金是体现一个科研单位科技自主创新能力的重要方面。文章以中国热带农业科学院热带生物技术研究所为例,从国家自然科学基金项目的申报管理和资助情况等方面着手
针对目前初中英语读写结合课中语言点教学存在的问题,文章结合案例具体阐述了如何在读写结合课中开展高效的语言点教学:深入文本,主线贯穿;语言聚焦,有章可循;形式意义,二者
“急起直追,勇往奋进……索我理想之中华,青春之中华……”穿越100多年的风雨沧桑,他那洪钟大吕般的声音,依然铿锵作响,撼人心魄。一袭长袍,圆脸黑须,目光深邃,神情镇定,是中
《水浒传》中鲁智深在五台山醉酒打坏金刚塑像、在大相国寺"倒拔垂杨柳",此两处情节皆有来历。从唐至宋元时代的文言小说及民间故事中探其源渊,则"倒拔垂杨柳"源于密宗"大力金刚"的
史籍中关于周公、召公以一子就封,另有子"世为王臣"的史实比较明确,但对于同为开国重臣姜太公是否有子"世为王臣"则文献无征。通过近来出土的西周青铜器师 钟、师 鼎、即簋、师臾
<正>受行业内外部因素影响,2019年上半年长江水路运输市场运行平稳、稳中有进,长江干线港口货物吞吐量同比稳步增长,企业经营效益总体同比略有下滑一、2019年上半年长江干线