蒙古文同形异音词的读音识别研究

来源 :内蒙古大学 | 被引量 : 8次 | 上传用户:lyhyes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蒙古文同形词有同形同音和同形不同音之别。同形同音词方面,已经有《面向信息处理的蒙古语名—动兼类同形词词类自动识别规则》和《面向信息处理的蒙文同类同音同形词自动识别研究》等研究成果。到目前为止,还没发现面向信息处理的蒙古文同形不同音词的专门研究,在500万词级《现代蒙古语文数据库》中还有大量的未经处理的同形不同音词。所以本文将以同形不同音—即同形异音词作为研究对象。 在蒙古文编码国际标准产生之前,我国境内出现的各种蒙古文编码都没能处理好蒙古文同形字母的问题。内蒙古大学蒙古学学院在建立500万词级《现代蒙古语文数据库》时,曾经采取从方正蒙古文编码文本到ASCII文本的转写措施,为语料库增添了许多内容。当时运行的转写软件,对文本中的同形异音词用“+”号作了简单的标记,以待后续处理。本文针对这些带“+”号的同形异音词,选取其中出现频率较高的(在100词次以上)140个词,根据它们在100万词级《现代蒙古语文数据库》中与其他词语的搭配情况,给出读音识别条件。对122个文件进行计算机处理的结果,自动识别的正确率达到99.01%。 全文由导言、第一章、第二章、第三章和附录组成。 导言部分,概述了蒙古文同形异音词的读音识别研究的意义、方法和步骤、研究基础以及国内外相关领域的研究现状,说明所用语料以及标记等。 第一章,说明本文要处理的同形异音词的来源。论述处理方法、过程、技术难点和重点等。 第二章,对蒙古文同形异音词读音识别条件中的标记和语料做了说明,给出了具体的读音识别条件。 第三章是结语。这里给出了测试试验结果分析,对本题目的学术价值和实用价值做了总结,并提出了进一步改进的思路。 附录部分是有关本研究的一些样例及参考文献。
其他文献
<正>从20世纪60年代中期开始,德国、瑞士、奥地利、荷兰和芬兰等欧洲国家陆续将职业性院校合并升格为应用技术大学,形成与普通大学相互补充、共同发展的双轨制格局。应用技术
小学语文新课程标准指出:学生是学习和发展的主体。语文课程必须根据学生身心发展和语文学习的特点,关注学生的个体差异和不同的学习需求,爱护学生的好奇心、求知欲,充分激发
商、周制度,有同有异,但最大的不同在于周行封建,于是整个封建帝国的组织便大体上以家庭为经、以家族为纬。如此,尊卑长幼的关系便十分重要。因此周制虽然多承殷商而来,但在“制礼
结合美术教学实践经验,以及在美术教学中对多媒体技术的学习和运用,分析多媒体技术对美术课堂教学的重要性,以及如何利用多媒体技术美化传统美术课堂教学。
探讨重组甲型流感病毒基质蛋白1和2(rM1和rM2)通过细胞外信号调节蛋白激酶(Extracellular signal regulated kinase,ERK)诱导小鼠气管上皮细胞产生γ-干扰素(Interferon-γ,I
<正> 阿勒泰地区的中草药品种,作者巳对1 089种做过报道。经请专家对多年来采集的标本进一步鉴定和参考有关文献,现对当地的药用植物资源包括变种及同属近缘植物81科728种、
进入二十一世纪,随着科学技术和经济的快速发展,机械制造自动化逐渐运用在各行各业,并且以很快的速度不断发展。其以机械制造为基础,融入计算机科学、信息技术、自动控制技术
3月21日是世界睡眠日,其重点是引起人们对睡眠重要性和睡眠质量的关注。护理工作是服务于人民大众的,是为人民的健康服务的,频繁的倒夜班,护士的生物钟发生紊乱,再加上来自家
高中物理是基于观察和实验的自然学科,实验能激发学生的学习兴趣,促进学生思维能力的发展。教师可以运用演示实验的教学方式,突破物理知识的教学难点,找到适合的教学手段,使
现代意义上的翻译理论研究始自上世纪50年代。它以语言学理论在翻译研究领域的广泛应用,即翻译研究的语言学走向形成为标志,并在80年代文化视角的引入,即文化学走向形成后,得