基于AdaBoost.MH算法的汉语多义词消歧

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wqvbqjxtid1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于AdaBoost.MH算法的有指导的汉语多义词消歧方法,该方法利用AdaBoost.MH算法对决策树产生的弱规则进行加强,经过若干次迭代后,最终得到一个准确度更高的分类规则;并给出了一种简单的终止算法中迭代的方法;为获取多义词上下文中的知识源,在采用传统的词性标注和局部搭配序列等知识源的基础上,引入了一种新的知识源,即语义范畴,提高了算法的学习效率和排歧的正确率.通过对6个典型多义词和SENSEVAL3中文语料中20个多义词的词义消歧实验,AdaBoost.MH算法获得了较高的开放测试正确
其他文献
广东某海上风电场处于开敞海域,涨落潮为不规则半日潮,流向复杂,风大浪高,海况复杂,地质条件较差;针对钢管桩单桩基础直径φ8.5 m、长113.57 m、重1823 t工况,分析了施工时的
电动葫芦是一种轻小型起重设备(见下图),主要结构有减速器,运行机构,卷筒装置,吊钩装置,联轴器,软缆电流引入器,限位器。
辅助汉语学习研究作为一个重要的研究领域,已经在自然语言处理领域激发起越来越多人的兴趣。文中提出一个基于字分析单元的辅助阅读系统,它可以为汉语学习者提供即时的辅助翻译
加强水稻种植技术的开发和推广应用,能够显著提高水稻的产量和品质,推动农业经济的现代化发展。本文主要结合实际工作经验,首先探讨了现阶段水稻种植过程中所面临的问题,并论
基于trigger对的长距离蒙古语语言模型采用统计方法进行自然语言建模。该文简要介绍了基于trigger对的长距离蒙古语语言模型的三种实现方法,并在汉语-蒙古语机器翻译系统测试