基于N-gram语言模型的哈萨克文机构名识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:jitlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的机构名进行识别,实验结果表明该方法可行。
其他文献
期刊
美化电脑已经成为凸显我们个性的最佳方案.也许我们可以给PC的外貌整容(不过.小编和笔者都一直认为内在美比外貌更重要,也就是美化外貌的操作系统)。俗话:“三分长相,七分打扮”,虽
孔子和苏格拉底这两位文化巨人。其思想是东西方教育和文化的基础与源泉,他们的教育思想有很多相同之处。然而。在宏观相同的背景下,也存在着许多不同之处。分析比较其异同点。
宫颈癌是全世界女性最常见的恶性肿瘤之一,其发病率和死亡率与经济水平相关。由于对患者的预后判断及治疗方式的选择仍依靠TNM分期等组织病理学分期方式,易受医生主观因素影
函数性质是高中数学巾的重要知识点,内容非常丰富,其中单调性、奇偶性、周期性、连续性是重点.这些内容纵跨整个高中数学,其数学符号本身比较抽象,再加上应用灵活,被多数同学认为是
为了提高基于Windows操作系统的入侵防御系统的检测效率、实时性和智能性,引入嵌入式汇编语言来简化对win-dows Native API的监控,将数据集划分为一组基本相对独立的变长序列模
分析了冷水机组中冷冻水和冷却水变流量对冷水机组效率和水泵能耗的影响 ,从而得出冷水机组的冷冻水采用变流量是可行的结论 ,综合节能效益显著 ,值得推广。
针对张家夏楼铁矿矿体赋存于厚大第四系含水层下,地表不允许塌陷,矿体倾角浅部较陡,深部平缓,矿体厚度较大的条件,选用下盘补充放矿的嗣后充填阶段矿房的采矿方法,以利于安全
《教育部关于新形势下进一步做好普通中小学装备工作的意见》(以下简称《意 见》)指出,“互联网+ ”战略引领信息化建设进入关键时期,教育装备工作面临新的机遇 和挑战.机遇来自
随着中国跨国企业的发展,企业组织内多元文化的碰撞在所难免。跨国公司中的企业文化建设问题,正好是多种文化碰撞冲突的交汇点。本文主要从发挥我国传统文化优势、遵循“和而不