藏文联机手写识别若干算法研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:xiaoc009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言文字的信息处理技术是人类社会现代化的重要成果。信息处理技术的水平已成为一个国家、一个民族发展进步的重要标志。改革开放以来,在实现汉语言文字信息处理技术的同时,我国少数民族语言文字信息处理技术也取得了巨大成就。从上世纪80、90年代起,藏语文信息处理工作取得突破性进展,然而在藏文的联机手写识别领域却仍处于起步阶段。   本文在总结了汉字识别和已有的藏文联机识别成果的基础上,在预处理过程、特征提取部分以及聚类部分进行了改进。在预处理过程中,使用了应用于图像处理中的数学形态学操作作为预处理中的去噪声方法,主要操作包括膨胀,腐蚀和细化;在特征提取阶段,在分析了原始特征值在后续计算中存在缺陷的基础上,本文对原始特征值进行了非线性变换,在网格方向特征提取时加入了网格的权值,从而增强了特征向量的区分能力;聚类使用的是k-means聚类方法,在聚类距离方面,我们在对比了各种距离测度方法后,提出了一种变型的欧氏距离计算方法,并将硬聚类方法改为模糊聚类方法,提高了算法的鲁棒性;为了提高系统区分相似字的能力,本文在借鉴了签名识别的方法后,实现了二级分类器,增强了其对细微差别的辨别能力。   实验结果表明,本文提出的改进方法对识别率有一定的提高,说明方法可行有效,适用于藏文的联机手写识别。
其他文献
制造业是我国国民经济的支柱产业,流程工厂作为制造业的重要组成部分,对社会经济发展具有十分关键的作用。随着CAD技术、协同计算技术的发展以及工厂规模的不断扩大,业界对流程
随着嵌入式系统性能的不断提高,越来越多的系统设计面临着高性能和低能耗所带来的矛盾,低功耗设计是解决这一矛盾的必然要求。动态电源管理(Dynamic Power Management,DPM)是实现
大规模双语平行语料库是构建高质量统计机器翻译系统的重要基础资源。在特定领域统计机器翻译应用中,使用与领域主题相关的平行语料作为训练数据能够获得好的翻译质量。本文提
本文主要研究媒体信息在网络传输中的拥塞控制以及引起的延迟。Internet上承载的音频、视频信息与日剧增,面对这如潮的信息流,如何解决实时流媒体在网络中顺畅、无误的传输,
近年来,随着多媒体技术的发展,图像处理在医学图像处理、图像信息安全和图像检索等领域得到了广泛地应用。室内室外图像分类是图像处理中的一个问题。其有效地分类能够为一些图
半实物仿真是将控制器与在计算机上实现的控制对象的仿真模型联接在一起进行实验的技术,工业产品的快速开发过程需要半实物仿真技术的支持。作为半实物仿真系统不可或缺的重要
随着互联网的快速发展,社交网络越来越流行,用户在社交网络上与结识的朋友进行交流。社交网络中的海量信息使得用户难以快速找到想要结交的朋友,链路预测是实现好友推荐的关键技
接收单元和控制单元是雷达高度计系统的重要组成部分。雷达数字化中频接收机一般采用FPGA+DSP实现,它具有直流误差小,IQ通道幅度一致性好、相位正交度高的优点。在雷达高度计
长期以来,由于信息化系统建设规范(标准)滞后或缺失,造成我国各级各类信息化系统难以互通,资源难以共享。这些异质异构的资源信息系统形成的一个个难以逾越的信息(资源)“孤岛”
Internet作为一个典型的复杂网络实例,对其宏观拓扑结构的特征分析及建模研究是目前研究的热点问题,受到学术界广泛关注。近年来人们在该领域的研究取得了长足的进展,尤其是在自