汉字图像识别研究

被引量 : 0次 | 上传用户:jasonmcp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字图像识别是计算机视觉与模式识别技术的重要应用领域。近年来,围绕汉字图像识别的研究已取得很多重要进展。但如何提取与类别密切相关的汉字图像特征,获得尽可能高的互信息熵仍是汉字识别的重点和难点,因此特征的准确提取与识别是汉字识别研究首先关注的问题。 论文涉及以下几个方面工作: 1、汉字识别特征的提取。研究了如何从汉字图像中提取横、竖、撇、捺等笔划特征信息,提出了汉字笔划的两种提取方法:1)提出了一种基于数学形态学的图像汉字笔划细化和提取方法。根据汉字的结构特点,研究制定了一组新的图像汉字笔划细化的结构元素序列,不仅有效地抑制样本汉字细化后笔划的扭曲和歪斜,而且保持了原样本图像汉字的连通性和拓扑性的骨架。在此细化的结果基础上,定义了一种基于边缘检测的新的汉字笔划提取算法。2)提出了基于Gabor滤波器的笔划提取算法。针对Gabor滤波器在纹理图像的识别方面能起到仿人视觉识别的特性,利用Gabor滤波器在时域中的方向性,分别在0、45、90、135度方向进行滤波得到四幅灰度子图像,再对四幅灰度子图像采用自适应算法和最优阈值算法进行二值化。两种方法均能提取出横、竖、撇、捺四个方向笔划的形状、形态、形式等结构和统计信息,效果良好。 2、汉字特征模型的建立和汉字图像的编码。在基于汉字特征的可识别性和可提取性基础之上,提出了选用笔划作为基元,采用先结构特征后统计特征的识别方法,运用模糊数学定义了汉字图形的笔划形态、形式、位置、长度等特征信息,并以此为基础构建一套新的汉字图形的特征模型和编码方法。 3、汉字图像的识别算法。围绕该汉字结构模型和编码方法,采用冒泡算法对提取出的待识别的汉字特征进行隶属度排序,建立了一套有效的识别算法。最后,给出了一种基于汉字图形轮廓特征的误差估计方法,并利用误差估计初步建立了一套带有反馈的汉字识别系统。
其他文献
煤矿生产安全监控系统、自动化控制系统与企业管理信息系统的综合集成是我国煤炭工业信息化发展的总体趋势。但目前煤矿行业的现状是每个系统自成体系各自处于封闭状态,系统
国内装载机大多仍然使用定量系统,其溢流调速特性使得系统必然存在溢流、节流及中位损失。该文对定量系统装载机铲装作业时的液压系统能耗分布进行了详细的分析,得出了在国内
美军在军事人才培养的体系构筑、目标设定、课目设置等方面有着众多独到之处。《军官职业军事教育政策》是美军规范军官职业军事教育的指导性文件,研究掌握其核心内容的发展
我国的中药饮片加工产业正在逐步的规范,但辽宁省的中药材种植及中药饮片加工产业却相对落后。广阔的市场空间与产业发展前景,决定了可深入发展辽宁省的中药材种植及中药饮片
行政诉讼原告资格转移制度是指在法律规定的特殊条件下,提起或继续参与行政诉讼的资格转移至没有诉讼资格的特定主体的基本制度。我国《行政诉讼法》对于这个特殊条件有明确
本文在马克思主义关于人的全面发展理论、公民道德实施纲要和素质教育理论体系的支撑下,坚持唯物辩证法,采用文献法、调查研究法、多学科理论交叉研究和实践性研究相结合,以
随着社会物质的富足和科技的发展,人的消费观念已经发生了巨大的转变。人们的价值取向发生了翻天覆地的变化,加上社会对与人类息息相关的各类产品造型的要求越来越高,导致了
<正>GBU-38精确制导炸弹GBU-38精确制导炸弹重227千克,是美军航空兵在役的最小精确制导炸弹。因其重量轻,成本低廉,美军战机可以携带更多的该型炸弹袭击更多的地面目标。在命
木质素作为木材水解工业和造纸工业的副产物,由于得不到充分利用,成为木材水解工业和造纸工业中的主要污染源之一,不仅造成严重的环境污染,而且也造成资源的极大浪费。木质素是一
自 1935 年 Ternnat 和 Wiggers 描述了冠状动脉结扎后局部心肌运动发生改变以来,人们对急性心肌缺血和心肌梗死后的病理生理变化有了进一步认识。至 70 年代,医学界开始使用