多字体印刷蒙古文识别后处理研究

来源 :中国中文信息学会二十五周年学术会议 | 被引量 : 0次 | 上传用户:adward006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展,各民族文字都面临着"信息化".西部大开发策略的实施,给我们少数民族文字的信息化带来了政策上的支持.为了把大量的书籍、报刊、单据、报表等"电子化",人们纷纷研制出各种省时、省力的计算机输入法.其中包括扫描输入法.虽然蒙古文识别研究开展得比较晚,但是通过借鉴其他文种的识别方法和经验.蒙古文识别研究进展得很顺利.本文介绍了多字体印刷蒙古义识别研究中所涉及到的一些基础性工作的进展情况,并提出了继续深入研究的内容.
其他文献
在统计机器翻译领域,基于短语的翻译模型的性能优于基于词的翻译模型.目前在基于短语的所有机器翻译模型系统中,源语言都是以均匀分布的方式进行短语切分,然后将所有可能的短
会议
在一九四八年,一百多万公顷上等的土地已经从摩洛哥农民手中移到四万五千个欧洲人的手中了,六百五十万摩洛哥乡民就只剩了七百万左右公顷贫瘠的土地,其中有一半是不可耕地!
机器翻译仍将是21世纪人工智能领域的难题之一.汉藏机器翻译的复句处理不仅要依托于分句(短语)的处理,而且还要超越分句(短语)去深入考察复句内各分句之间的内在联系,实现藏
本篇文章通过对汉语中谓词以及结构辅助词的分析研究提出了一种基于谓词驱动模板的机器翻译方法.谓词驱动模板方法将谓词以及结构辅助词固化在模板中,实现句子级的结构精确匹
会议
本文提出了一种基于规则的多层过滤进行机器翻译的方法.该方法实现了英语人名向维吾尔语的自动翻译.该方法不同于传统的机器翻译方法,它不需要建立丰富,完整的词库.本机器翻
会议
在科技文献中存在大量的中英文与公式的混排现象,如果在识别前能正确把它们进行区分并使用不同的0CR将可以极大地提高文档的识别正确率.本文通过结合两个不同的OCR识别结果以
碳酸镧(lanthanum carbonate)是一种新型非钙、非铝的磷结合剂,主要通过抑制胃肠道对血清磷的吸收起到降低血磷的作用,尤其适用于不能使用含钙磷酸盐结合剂的慢性肾病矿物质
特征降维问题是汉字识别研究的重要内容.本文将测地路径(geodesic paths)与非参数化降维相结合,提出了优化的降维方法.为解决大规模模式识别问题,本文同时给出了算法的化简策
目的 预测和对比单用二甲双胍血糖控制不佳的中国2型糖尿病患者加用利拉鲁肽或西格列汀的长期健康结果.方法 患者基线特征、治疗方案、治疗效果等数据来源于LIRA-DPP-4 CHINA
本文重点研究语音识别系统中信号的抗噪性前端处理方法.将线性预测(LP)分析与形态滤波结合作为语音识别的前端处理方法,并选用具有抗噪性的MFCC特征参数.将上述方法应用于基