基于无指导机器学习的全文词义自动标注方法

来源 :自动化学报 | 被引量 : 0次 | 上传用户:wuhaha_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行丁比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分析手段对上下文特征词进行选择.最终确定的词义标注方法可以使用大规模语料对模型进行训练,较好的解决了数据稀疏问题,并且该方法具有标注正确率高、扩展性能好等优点,适合大规模文本的词义标注工作.
其他文献
本文针对海成河流域的暴雨洪水特性,利用海城水文站的洪水观测资料制作了该流域的洪水预报方案,并以实例进行演算,取得很高的洪水预报精度。其成果对做好海城河流域洪水预报
A semantic unit based event detection scheme in soccer videos is proposed in this paper.The scheme can be characterized as a three-layer framework. At the lowes
在无线传感器网络(WSN ) 的节点本地化是被对待一功能目标在纸从一个新奇观点追踪双。与在 WSN 的传统的追踪问题不同,使用静态的地点商品节点估计动人的目标,活动节点被用来帮
利用寿命的周期费帮分析方法,对焦耐电站锅炉给水泵两种改造方案进行了比较,认为改用一种新泵的方案优于原泵改造的方案。
The physiological mechanism of maintaining the green colour of pak choy leaves (Brassica rapa var chinensis) with heat-shock treatment was studied. Chlorophyll
针对纸币上常见的笔划及撕裂,提出了一种基于均匀性牲的污损检测方法,首先利用均匀性牲判定待检纸币上可能存在污损的区域,然后进行图像配准,确定这些区域在参考图像上的对应位置
土壤含水量是干旱区旱情分析不可缺少的水文要素。准确监测干旱区的土壤含水量,对旱情分析、灾害评估、抗旱决策具有重要意义。插管式土壤水分采集仪具有独特的优势和特点。本文结合吉林省墒情监测工作实际,在没有任何经验可借鉴的情况下,在全国率先开展了如何提高插管式土壤水分采集仪监测精度的研究,总结出一套非常实用、可操作性强的操作规程,并应用于旱情监测的实际工作中,收到良好效果,具有推广和应用价值。
采用GECOR8钢筋锈蚀程度测定仪来测定评价一座早期混凝土渡槽的锈蚀情况,并根据检测成果提出处理与锈蚀钢筋渡槽改造再利用的方法。改造后的渡槽经连续二年的监测结果表明,混