基于N-gram语言模型的哈萨克文机构名识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:5201314520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统.系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的机构名进行识别,实验结果表明该方法可行.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
The predictive calculation of comprehensive contour of work rolls in the on-line strip shape control model during hot rolling consists of two important parts of
Several groups of direct shear tests of Nanning expansive soil samples were carried out by improved direct shear apparatus. The results of the characteristics o
The variation of yield strength along rolling direction, transverse direction and 45° to transverse direction of 2090 Al-Li alloy and 2090+Ce alloy sheet conta
晚清时期西方人掀起了汉语学习的第二次高潮,在这100多年的时间中,他们编写了卷帙浩繁的汉语教材,这些教材类型丰富,从不同的角度可以划分为以下几个类型:翻译型教材和自编型教材
现代中学学校管理中“以人为本”,就是在管理实践中对学生的主体性地位的确认,对学生的全面发展价值的尊重,对中学教师的客观需求的满足,要实现这一理念要求,应该在办学理念、育人
高中数学课程对于提高分析问题和解决问题的能力,形成理性思维,发展智力和创新思维起着基础性作用。分析问题和解决问题的能力是指能阅读、理解对问题进行陈述的材料;能综合应用
大规模风电机组的快速接入严重影响电网安全稳定和风电的接纳能力,在电网结构未有大的改善之前,只有依靠科学合理的调度模式和原则才能保障风电的稳定多发.文中以甘肃电网实
为了充分利用广域量测系统(WAMS)的量测信息,提出了一种在混合量测系统中利用潮流信息的故障诊断方法.首先指出了根据WAMS量测量实现故障唯一辨识的数学条件,为PMU配置提供了