基于层叠隐马尔可夫模型的蒙古语词切分系统的研究

来源 :内蒙古大学 | 被引量 : 15次 | 上传用户:jhf44623386
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在蒙文信息处理工作的词处理阶段,自动切分词干、词缀是多项后续工作的基础。如:词干和词缀的统计,各种词典的编制,进行句处理、篇章处理以及信息检索等都需要以正确的“切分”为基础。蒙古语是黏着型语言,它的构词和构形都是以词根、词干上连接不同的词缀来完成的。这些缀接的附加成分包含大量的语法信息,如果把蒙古语词作为一个单独的整体来处理的话就会损失大量的信息。只有正确切分词根、词干和词缀才能揭示其词类属性和语法关系。本文介绍了蒙古语词切分问题的来源与意义,并对当前存在的蒙古语词切分技术进行了对比分析;对隐马尔可夫模型的相关理论和技术进行了探讨,简要介绍层叠隐马尔可夫模型的含义和优势;对蒙古语语言特点进行了分析和特征提取;对基于层叠隐马尔可夫模型的蒙古语词切分中涉及到的关键技术进行了分析;针对蒙古语构词、构形的特点结合层叠隐马尔可夫模型进行蒙古语词切分;对常用的平滑技术进行了分析,着重介绍本文使用的Modified Kneser-Ney平滑。从实验结果看,基于层叠隐马尔可夫模型的蒙古语词切分有较好的性能,得到了令人满意的切分结果:0.9713。
其他文献
随着Internet的发展和Web服务数量的增多,Web服务越来越难被准确地搜索。其原因有四个方面:①WSDL主要是对服务的参数类型、消息格式、服务操作、绑定协议和服务地址等物理信
目的:观察电针对胰十二指肠切除术后胃肠道功能恢复的干预作用.方法:将行胰十二指肠切除术的74例胰腺及壶腹部肿瘤患者随机分为治疗组与对照组,每组37例.对照组于围手术期至
陈自明所著《妇人大全良方》是我国妇产科学的奠基之作,该书“求嗣门”详细地论述了不孕不育症的诊治,其学术特色鲜明:(1)三因皆可致病,病机重在气血不调;(2)注重调理气血,次
随着信息技术产业和宽带网络的快速发展,云计算技术已经达到一个崭新的高度,加上用户对智能手机等移动终端设备的使用率不断上升,移动云计算渐渐地在各个行业展现出其强大的魅力
超市是现代社会中必不可少的购物场所,在近年来零售业蓬勃发展以及新零售概念的冲击下,传统的线下超市正逐渐与线上融合,变得越来越数字化,甚至在一些城市已经出现了无人超市。数字化改造的一项重要内容就是货架管理,货架作为商品的载体,是超市的核心,从传统的理货员人工货架管理到自动化智能货架管理,这一改变能够大大提升管理效率与用户体验。针对智能快速地获取货架上摆放的商品种类与数量的需求,本文研究了货架图像商品
随着全球信息化脚步的不断加快,数据集成的需求由来已久。如何利用灵活的、有效的方法,将原本分离的数据源中的异构数据无缝、透明的集成起来,成为数据集成领域内讨论的热点
随着国民经济的发展,国民生产总值的增加,汽车工业和道路交通运输事业得到了高速的发展。随着人们的生活水平不断提高,中国私人机动车保有量也在不断增长,这些方面都给我国的
[本刊综合报道]2020年9月26—28日,首届长三角健康峰会(溧水)暨中医药博览会在江苏白马农业国际博览中心成功举办.为期3天的峰会,包括10位院士、国医大师及70余位专家、学者
期刊
全军和武警部队首次开展的优质党课评选活动日前揭晓。总政治部发出通报,对24课优质党课和授课人员予以表彰。今年全军和武警部队开展的评选优质党课活动,是迎接十七大召开、
Tennessee Williams is one of the most prominent American dramastists in the twentieth century. Cat on a Hot Tin Roof is his another masterpiece, which won the P