银行票据OCR系统中若干关键技术的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:dfg4g4354yh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文在国家863计划的资助下,建立了国内最大的脱机手写汉字数据库—HCL2000,该数据库不仅包含汉字字符库,而且还包含相应的书写者信息库,因而既可为开发手写汉字识别算法提供训练和测试样本,也可用于研究各类人员的文字书写特征,探讨文字书写的相关因素.对训练样本的选择一般采取聚类的方法,传统的聚类算法存在着很多不足和缺陷,容易陷入局部最优,难以取得全局最优,该论文提出了一种新的K值可以变化的FCM-VKNN(Fuzzy C-Means Variable K-Nearest Neighbor)聚类算法.FCM-VKNN聚类算法充分吸取了FCM算法和KNN准则的长处,使本算法不受初始值的影响和固定值K的束缚.新的目标准则函数考虑了数据集样本的模糊隶属关系和样本几何分布两个方面的因素,使算法的鲁棒性和分类的正确性大大加强.该课题结合银行票据OCR系统的开发,对手写汉字识别结果可信度进行研究.该文提出一种新的手写汉字识别结果可信度的测定方法.该方法将各种识别结果的正确率作为测定识别结果可信度的绝对尺度,以各候选字的相对邻近度为基础定义了测定可信度的一种新的相对尺度,并将这两个绝对尺度和相对尺度相结合来全面测定可信度.论文的最后部分介绍了系统软硬件体系结构设计、系统性能指标的确定和控制、各元素的性能指标的确定、元素间的接口等,实现了良好的性能.
其他文献
基于小波变换的图像编码技术是近年来多媒体领域的一大热点.零树编码算法是目前公认的效率最高的小波系数处理算法,可以在相同的压缩倍数下得到最好的复现图像质量,而且是嵌
该课题首先介绍了EDA(ElectronicsDesignAutomation)的基本概念以及当前集成电路的设计流程、设计工具和设计语言,分析了在设计时用到的Modelsim软件和VHDL语言,陈述了SoC的
该文通过讨论标记的分配、封装以及标记栈等问题,详细说明了MPLS的基本模型及其工作原理.几乎所有的协议都可导致形成环路,标记交换也不例外,因而瞬时环路的问题也成为MPLS必
该文在对自适应速率控制算法和解码端错误隐藏算法研究的基础上,实现了基于全数字无线扩频通信机的端到端流媒体传输系统.该文的研究工作与成果如下:一、设计了一个MPEG-4视
  本试验以“实优1号”大果沙棘品种为试材,研究沙棘组织培养的最佳培养条件,以建立完整的沙棘离体快繁体系,并探讨不定根形成的生理生化机制,为提高沙棘组培苗生根率提供科学
现场总线是目前国际上过程控制领域的一个热点,通过现场总线,数字通信技术可以延伸到现场级仪表,给控制体系带来一场革命。HART协议作为一个开放性的协议,现已成为智能仪表的“事
超宽带无线通信技术作为无线通信领域的新兴技术,在近年来受到了越来越多的关注。基于多带正交频分复用(MB-OFDM)的超宽带系统有着抗多径衰落、抗符号间干扰、传输速率灵活、
本文研究了铜对大鼠海马CA1区神经元A-电流和延迟整流钾电流的影响。结果表明:急性铜暴露对大鼠海马CA1区神经元A-型钾电流的影响胞外1,10,30,100和1000μMCu2+以剂量依赖性的方
随着人类航天活动的增加,空间碎片日益增多。在轨航天器与空间碎片发生碰撞的概率增大,正常运行受到了严重威胁。因此,对空间目标的观测与定位具有重要的研究价值。  本文通过
在该文中,考虑借助计算机网络来构建一个基于LAN的集群共网,可利用现有的网络设备,并应用中间件技术实现客户机与服务器之间的自主通信,采用基于TCP/IP协议的IP交换技术,这样