二级印刷体汉字的识别

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wk4605300051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种利用数学形态学提取汉字结构特征进行汉字识别的方法。该方法模仿人的认字过程,根据汉字构造的基本规律选取字的边框特征和局部特征,所取特征可适用于多体印刷体汉字的识别。用传真机输入的6763个二级汉字进行了实验,分类稳定,正确识别率为95.2%。
其他文献
本文根据发声器件的频谱曲线建立模糊关系矩阵,然后分别采用传递闭包法和最大树法进行模糊聚类.两种方法所得聚类结果完全相同.
期刊
本文运用最优化理论,依据一组实测点对其最佳拟合直线之最大误差点的交错性,及对不交错类型的判别所提供的优化方向,在参数空间中进行搜索,求得最佳拟合直线。从而实现用微机对A/D及D/A转换器的线性误差E_L之精确、快速计算。对于具有同样数学描述的其它工程问题,这种算法也是适用的。
期刊
本文扼要提出了视觉机理上的动态图象分析问题,着重介绍动态图象中目标运动估计的两种方法——微分法及Fourier法的基本原理。
期刊
本文从实践经验中提出了汉字编码中分隔、查找、重码处理和联想等重要的软件支撑技术,分析其优缺点及适用的范围。进一步把语言文字知识和软件结合起来,使汉字编码研究提高到一个新的水平。
期刊
本文介绍工程CAD中结构分析前后处理绘图系统GRAPH-W的原理和算法。利用这些原理和算法研制的绘图系统可以绘制出结构图、位移图、振型图、消隐线图、等值线图等结构分析中的常见图形。
期刊
本文阐述并总结了实体造型的一些理论和关键算法,如正则集理论,基于推广的欧拉公式的表示模型,集合成员分类。然后在扼要地介绍了实体造型的现状之后,提出了几个值得注意的研究方向。
期刊
八叉树编码方法是目前计算机图形学、图象处理和CAD/CAM技术中的一种新的方法。由于采用这种方法表示物体后,对物体进行相干性判别和消除隐藏线(面)操作变得容易而越来越引起人们的兴趣。但由于八叉树编码方法占用的内存太多,而且采用的数据结构是一个非线性结构(树状结构),因此不令人满意。而线性八叉树编码方法很好地解决了上面这两个问题。线性八叉树编码方法由Gar-gantini引入,但她没有给出线性八叉树
期刊
本文提出了一种用计算机从手写汉字中抽提出三角号码基本特征的方法,并对抽出的汉字三只角上的特征进行编码,以达到识别分类的目的。从信息论的观点进行研究已经知道,汉字图像的四周对于文字识别的信息量是相对集中的,如果能正确地抽取这些特征,识别就成为可能。具体方法如下:(1)将手写汉字正规化,除去噪音,抽出方向线段,提取特征点的座标及接续关系矩阵。(2)在汉字图像上找出右上、左下、右下三个角上的基本特征点,
期刊
论述林木种子裹衣目的及有关技术要求。分析种子群体在空心扁圆球形体锅中的受力及运动规律。为设计其专用设备提供理论依据。
期刊
柑桔缺锌导致发生叶脉间缺绿症,喷施锌肥后此种症状即可消除。使用电镜研究了缺锌柑桔树叶片及喷施锌肥消除缺绿症后的叶片超微结构,发现缺锌叶细胞的主要特征是细胞质基质、内质网及核糖体稀少及叶绿体中包含有大的淀粉粒。喷施锌肥后可使细胞结构恢复正常,细胞质浓厚,叶绿体数量增加,并出现大量多种形态的粗面内质网,从而可改善氮素代谢,促进光合作用,增加产量,改良品质。
期刊