多字体印刷蒙文字识别技术的研究

来源 :内蒙古大学 | 被引量 : 16次 | 上传用户:qq4156500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别是集模式识别、人工智能与文字处理于一体的高新技术,能自动地把文字或其他信息通过智能识别输入计算机,用以代替人工输入。文字识别不仅有广泛的应用领域,而且也促进了模式识别、文字处理技术的发展。该领域一直是国际上计算机智能技术的研究热点,也是我国高技术研究计划(863计划)重点支持的主题。蒙古文是内蒙古自治区的主体民族语言,在中国,使用蒙古文的地区除了内蒙古自治区,还有黑龙江、吉林、辽宁、新疆等省和自治区。目前,大部分输入方法的研究集中在键盘编码输入方式上,对蒙文字识别的研究非常少,关于印刷体蒙文识别输入的研究还是一个空白点,这严重地制约了信息技术在少数民族地区的普及和应用。针对这种现状,我们提出研制多字体印刷蒙文识别系统,为蒙古文的输入提供一种智能的输入方式,这对继承和发展少数民族文化、促进民族地区的社会进步具有重要的意义。 蒙文在内蒙古自治区使用广泛,但输入均使用键盘编码输入方式,蒙文自动识别输入还是一个空白点。因此本课题的研究为蒙文输入提供了一种新的自动化和智能的方式,使蒙文信息处理达到一个新的水平。蒙古文字是拼音文字,但其书写方式在当今世界是非常独特的,与汉文和西文有很大不同。蒙文是从左到右、从上到下竖写,每个词中所有字母连着写,形成一个竖直的主干线,且每一个字母在一个词中的词首、词中和词尾所取的字形不一样。这些特点给蒙文的识别带来很大的困难。因而在研究的过程中,我们不仅要充分消化和吸收西文和汉文识别所采用的技术,还要结合蒙文书写的特点有所创新,才能较好地解决所遇到的困难。研究课题的目的是:从文字识别的角度来研究蒙文字特征的选择及特征提取、基元分割、匹配等一系列问题,开发出一个有良好人机界面,操作方便的多字体印刷蒙文识别系统。
其他文献
随着汽车工业和信息技术的迅猛发展,现代汽车集成了越来越多的复杂电子元器件。为满足管理日益增多的电子控制单元的需求,实现应用软件间的可移植性以及不同厂商所生产的控制
分布式组件模型具有跨平台、跨语言以及易扩展等优点,企业希望通过多种硬件平台的异种类型组件之间的通信,来迅速的构造一个应用系统。对于企业应用来说,基于不同规范的分布式组
随着目前基于IP的宽带网络的迅速发展以及数字信号处理、压缩编码技术的日益成熟,许多新的多媒体通信方式产生了。如何选择合理的多媒体通信技术为用户提供更丰富的业务成为各
测评在学习过程中起重要的评测反馈作用,是e-Learning中的关键部分。然而现有测评系统中试题资源缺乏统一的格式,各系统具有各异的体系结构,严重阻碍了学习对象的重用和系统的互
心脏是人体的重要器官,近年来心脏病的研究取得了长足的发展,但是人们对心脏更深层次上的认识以及心脏病预防和治疗远没有达到理想地步。因此,为了更深入地研究目前仅靠生理实验
随着数字电视、Internet流媒体以及DVD视频的广泛应用,视频压缩编码逐渐成为计算机多媒体技术的关键组成部分.数字电视以及DVD视频原本是在MPEG-2的基础之上发展完善起来的,
随着网格技术的日益发展,作为对数据应用需求的回应,在计算网格之后出现了数据网格的概念。在网格环境下如何访问已有的数据库,如何提供一个访问不同数据资源的统一接口,并且
学位
网络安全事件的不断发生使我们日益感觉到网络安全本身的重要性,而安全入侵的不断复杂化则让我们更加体会到单一的安全防护在其技术上所具有的种种缺陷,所以一个完整的安全防
作者在对国内已建成的供水管网地理信息系统的考察中发现,目前国内还没有出现应用十分成功的GIS供水管网管理系统。就供水行业的GIS的开发,从用户分析、系统设计、数据库建设到