基于小规模语料库和机器可读词典的二元分布语义获取

来源 :中文信息学报 | 被引量 : 5次 | 上传用户:mikesh123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于小规模语料库和机器可读词典 (MachineReadableDictionary ,MRD)的无指导的动词语义获取方法。该方法不需要使用有义项标注的语料库 ,而是使用从语料中获得的V +N搭配以及MRD中多义词定义的应用实例中获得的知识。使用两种方法解决数据稀疏问题 :首先 ,将词的相似性度量由直接共现扩展到共现词的共现 ,以共现聚类而不是共现词来计算词的相似度。其次 ,从MRD定义中获取名词的IS-A关系。通过这些方法 ,即使两个词不共享任何词 ,也可认为是相似的。实验表明 ,该
其他文献
解决蒙古语基本名词短语的定界问题,是在蒙古语词性标注语料库的基础上进行的探索性研究.基本名词短语的内部结构信息对其定界问题具有重要作用.确定基本名词短语内部结构的
在基于向量空间模型的信息检索系统中,TF-IDF算法被广泛的应用在基于关键字的信息检索中.然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接
“上帝欲使其灭亡,必先使其疯狂”。西方谚语中的上帝当然并不存在,但某些人不断滋生的贪欲,却让他们失去对法律的敬畏,最终被法律之绳所绑缚。  2006年6月29日,十届全国人大常委会第二十二次会议闭幕。当天下午,会议发布公告:海军本届军人代表大会接受了王守业提出的辞去全国人大代表职务的请求。依照代表法的有关规定,王守业的代表资格终止。  新华社当即报道了此事,并称,拥有中将头衔的王守业已被中央军委免
缺水已经成了人类社会的共同难题。  联合国原秘书长安南说“目前世界范围内的水储量正在下降,地下水源面临枯竭,河流湖泊水域在缩减,农用化学品严重污染水质,加上人口不断增加等原因,各国特别是发展中国家水资源紧缺问题越来越严重。”  在20世纪的100年中,人们的取水量增加了5倍,达3800立方公里。其增加速度,相当于同期人口增长速度的两倍。人均淡水量则在不断减少。  1995年世界人均水量为7300立