文档识别中误切分字符拒识问题的研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wyk3601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度,在此基础上改进了常用的广义置信度映射函数,并设计了一个基于样本学习的拒识规则,提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明,该文算法明显改善了系统性能,对于较代质量的印刷文本识别具有一定的普遍意义。
其他文献
基于Multi-Agent的信息服务模式直接影响MSAS的组织及Agent的通信规则。文章对Intetnet上信息服务模式进行了系统的分类,并且举例说明了每种服务模式对树形拓扑多Agent系统上
对一般多专家系统的管理和控制问题,提出了一个新的概念:管理控制知识,它是多专家系统的特有知识,用于对多个专家系统的合作和单专家系统的执行过程等进行管理和控制,该文分析了管
方言就是地方话。现代汉语方言,根据它们在语音、词汇和语法上的差别,可分为北方、吴、闽、粤、湘和客赣六个方言区。一种方言要在一个地区通行,中国版图太大,因而,同为中国
文章提出了采用按需路由发现策略的移动分组无线网多播路由算法。在算法中不需要维护全局的路由信息,通过按需路由发现过程,动态更新路由信息和建立多播转发组。多播数据包在转
光功率计只能检测单通道信号,通过数字滤波系统不仅可以实现多通道同时检测弱光信号,而且较硬件电路检测来说灵活性高,检测精度也可以和进口设备相媲美。
近年来中药治疗腰椎间盘突出症的文献资料表明单独或综合应用于腰椎间盘突出症的治疗,均有一定疗效。广大研究人员对治疗腰椎间盘突出症的中药进行了大量的实验研究,现将其研究
良好的习惯就如我们呼吸的空气、饮用的水一样不可缺少。没有空气,孩子们会窒息;没有水,孩子们会干渴,那么没有良好的习惯。孩子们会营养不良,更不会成为德、智、体、美、劳
在机械故障诊断中,通常不具备有大量的故障样本,因此,制约了故障诊断技术向智能化方向发展,而基于统计学习理论(SLT)的支持向量机(SVM)方法正好克服了这方面的不足,统计学习理论是专门
文章通过对软件可靠性因素的定义和分析,提出了软件可靠性的综合评估指标体系,在计算机可靠性因素对软件可靠性影响程度的基础上,实现了软件可靠性的定性评估,该模型改变了通常把
介绍了基于人眼虹膜的一种生物识别技术,描述了虹膜识别系统的组成结构与实现,给出每部分组成模块,并详细讨论了虹膜识别算法。