蒙古文识别文本后处理字素合并模块的实现

来源 :内蒙古民族大学学报 | 被引量 : 0次 | 上传用户:lostcity_online
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要讨论了蒙古文识别文本后处理字素合并模块的实现过程,包括字素合并的难点、合并规则库的设计、处理方法、转换过程、字素合并二义性现象等。在字素合并过程中,主要采取了基于规则的方法,其在规则库的建设过程中,利用了很多蒙古文语言知识,可以说字素合并规则是蒙古文字符特点、构词、构形、正字法等语言知识的形式化。经过试验,合并准确率能达到93.661%,并已成功地应用于“多字体印刷蒙古文(混排汉荚)文档识别系统”中。
其他文献
<正>随着互联网尤其是移动互联网的高速发展,不仅使得传播载体发生了巨变,也使得舆论场一直在发生相应的改变,舆论场上的声音在社会进程中也起到愈加关键的作用。在这一大背
期刊
设计了一种用于1024&#215;1024CMOS图像传感器的内插式模数转换器(ADC)结构。转换采用并行处理方式,采用内插式结构,与流水线ADC相比速度更快。电路采用失调纠正技术和衬底驱动技