基于粗集的汉语词语义项知识的获取

来源 :中文信息学报 | 被引量 : 17次 | 上传用户:paltx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于自然语言语序的灵活性 ,使得自然语言知识的自动获取很困难。本文基于粗糙集理论的属性值约简方法 ,结合基于记忆的学习 (MemoryBasedLearning ,简称MBL) ,提出了一种汉语多义动词义项知识的获取方法 ,用该方法获得的知识可用于词义消歧
其他文献
在多年学习、使用、翻译与参与评审几种规范IT名词集的基础上,本文将系统分析方法用于对此类名词集的定名与评价.其基本方法,一是从名词集中拆分出基础要素--名词元;二是提出
报道了硅灰石与盐酸反应在PH≥2条件下的反应模式,并从反应产物颗粒形态、粒径分布、表面电位、比表面积等性质及反应动力学规律来证实这种反应模式。
穿插在江西广丰早白垩纪红盆中的碱性基性岩,K-Ar年龄为40.6 Ma,基性岩中辉石有基质、斑晶二种类型三个世代,早世代辉石斑晶为巨晶、堆晶,是"Ⅱ型包体";晚世代辉石斑晶为小斑
Linux系统对少数民族文字的支持需要建立在国际化机制基础上,本文在总结现有Linux国际化框架层次结构基础上,分析了X核心系统国际化的一些关键问题,并以增加藏文支持的实践为
在世界经济企稳回暖,中国经济强劲增长的背景下,位于浙江杭州的开氏集团有限公司更是一路高歌。最近4个月,全公司每月实现利润5000多万元,上交税收2000多万元,预计11月将实现利税1
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在.为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑.屏幕实时解释引擎是目前各种在线字典、
分级识别的策略在模式识别领域中提出相当长的时间了。尽管人类可以训练地使用这个策略进行识别 ,但对语音识别而言 ,缺少一个有效的系统化的方法来实现它。本文给出了我们最近在这方面做的一些研究工作 ,使用了子空间划分原理来实现一个分级识别器 ,并用树型结构来组织多个识别器。实验结果表明 ,该方法与传统方法相比 ,误识率降低 10 %。我们将在未来的研究工作中 ,测试全部汉语音节 ,并将该方法扩展到连续语
在湖泊中存在三种三角洲类型,即正常三角洲,辫状三角洲和扇三角洲。它们均由三角洲平原、三角洲前缘、前三角洲三部分所组成。陆相地层具有强烈的旋回性,只要将基准面看成海平面
赣东加里东变质混合岩带,是以混合岩体为主体,受韧性剪切带控制的多相、多型、递增变质带,是受区域深构造控制的热变质带.该带产有茅排式金矿.通过对该带金地球化学特征和地
目前由于特定任务域语料的稀疏并且难以收集,这严重阻碍了对话系统的可移植性.如何利用在线收集的少量训练语料,实现语言模型的快速自适应,从而有效提高对话系统在新任务域的