基于模式—向量转化和转化程度函数的汉字识别

来源 :上海海事大学 | 被引量 : 0次 | 上传用户:c472559561
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字是中华文化集体智慧的结晶,进入信息时代后,原来依靠图形记载在纸上的汉字有了电子化的记载方式。汉字识别是研究如何使计算机能够“识字”的工作,它涉及模式识别、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术,在中文信息处理、办公室自动化、人工智能等高技术领域,具有重要的实用价值和理论意义。 本文介绍了属性论方法的基本观点、理论和方法,提出了基于模式——向量转化和定性映射及其转化程度函数的汉字识别方法,讨论了该方法与经典统计模式识别方法中的特征抽取和结构模式识别方法的结构分析法的关系,并指出,因经典统计模式识别方法中的特征抽取可看作是一个模式——向量转化操作,而结构模式识别方法的结构分析则可看作是由诸子模式构成的一个(超级)向量,故也可理解为一种模式——向量转化操作,由于向量识别可归结为一个定性映射,所以,本文在一定程度上可融合两种经典方法的优点。 还有必要指出的是,本文之所以采用Gauss型定性转化程度函数用于相似度的计算,不仅仅因为它本身表达的就是向量X向向量G转化的程度,因而也就是X和G之间的相似度,还在于它能诱导出一个人工神经元,并具有导致定性基准模糊化的特征,同时,还可以避免因采用cosθ作为相似度而存在的以共线性代替相似性的隐患。 正由于这些原因,在本文所开发的系统中,经样本学习后所生成的汉字模式记忆库和相应的汉字识别过程,不仅具有人工神经元的并行分布式计算特征,而且,其识别和分类操作还具有明显的模糊化特征。 本文在学习的过程中能够生成实在、可见的记忆库,并且学习的速度很快。然而,利用属性论方法进行汉字识别还处于试验和探索阶段,也存在着一些缺点和不足,需要在今后不断的改进和提高。
其他文献
随着 ITS(智能交通系统) 的发展,作为其一个分支的公交系统,由于和人们的日常生活息息相关,对该系统的研究与应用,已经成为人们热心关注的焦点。目前国内多家公司都在进行公
近年来,由于面向对象程序设计方法具有确保软件质量、可重用性、灵活性、可维护性、可扩展性的技术,因而得到广泛的应用。目前,大多数的企业开发仍使用关系数据库。因此,对于面向
粗粒度可重构结构(CGRA)为多媒体处理程序等数据密集型应用提供了灵活且高效的加速方式。CGRA应用映射决定了应用程序在其体系结构上的实现方式,其针对给定的CGRA应用功能和体系
目前,在一个系统内,各个基层部门在Internet上已经建立了大量的数据库,但是这些数据库缺乏相互之间的信息共享,形成“信息孤岛”。校园信息化过程中也碰到了同样的问题,各个部门都
在当今这个信息化的时代,网络技术正在以前所未有的速度飞快发展。随着宽带网络进入家庭和流媒体技术的不断成熟和发展,利用普通家庭电视在线访问互联网上丰富的资源成为一种极
光突发交换(OBS)是近年来出现的一种很有前途的新型光交换技术。我们针对OBS网络的资源竞争问题,提出了一种旨在减少网络资源竞争冲突的新型资源预留机制——区分型资源预留机
高温构件服役一段时间后,会发生蠕变损伤,从而导致其性能劣化。因此,准确预测高温构件的损伤和剩余寿命,对防止非计划停车、拟订合理的维护和检修计划、保证生产和设备安全具
随着计算机技术和网络技术的发展,基于自律计算思想的高可用集群系统逐渐成为研究的热点,它不仅具有高可用性,而且还能降低管理成本。 本文作者参加了一个实现自律计算的
XML是可扩展标记语言(ExtensibleMarkupLanguage)的简称,具有有效的表达各种信息、数据和使各种应用协同工作的能力,它已经成为Web上数据发布和数据交换的事实标准。XML是典型
序列比对算法用在许多不同的领域。当前,这些领域里面的一个重要应用就是比对大分子,例如比对DNA和蛋白质序列,以及蛋白质结构比较。基本上,所有的序列比对算法,或多或少都会用到N