文档识别中误切分字符拒识问题的研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：wyk3601

【摘要】

：

自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息，很容易产生误切分图像块，需要字符分类器给出一定的反馈才能准确切分，为此提出了一个新的拒识算法，目标是尽可能准确地

【作者】

：

陈臻刚丁晓青等

【机构】

：

清华大学电子工程系智能技术与系统国家重点实验室

【出处】

：

计算机工程与应用

【发表日期】

：

2002年17期

【关键词】

：

文档识别误切分字符拒识问题字符识别置信度拒识规则 OCR Character Recognition Confidence Rejection Rule

【基金项目】

：

国家863高技术研究发展计划(编号:2001AA114081),,国家自然科学基金(编号:69972024)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息，很容易产生误切分图像块，需要字符分类器给出一定的反馈才能准确切分，为此提出了一个新的拒识算法，目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度，在此基础上改进了常用的广义置信度映射函数，并设计了一个基于样本学习的拒识规则，提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明，该文算法明显改善了系统性能，对于较代质量的印刷文本识别具有一定的普遍意义。

其他文献

基于Multi—Agent的Internet信息服务模式

基于Multi-Agent的信息服务模式直接影响MSAS的组织及Agent的通信规则。文章对Intetnet上信息服务模式进行了系统的分类，并且举例说明了每种服务模式对树形拓扑多Agent系统上

期刊

MULTI-AGENTINTERNET信息服务模式多Agnet系统代理服务模式Multi-AgentSystem(MAS)Information S

多专家系统中管理和控制结构的研究

对一般多专家系统的管理和控制问题，提出了一个新的概念：管理控制知识，它是多专家系统的特有知识，用于对多个专家系统的合作和单专家系统的执行过程等进行管理和控制，该文分析了管

期刊

多专家系统管理控制结构知识表示Multi-experts SystemManagementand Control Knowledge(MCK)Kno

漫说方言

方言就是地方话。现代汉语方言,根据它们在语音、词汇和语法上的差别,可分为北方、吴、闽、粤、湘和客赣六个方言区。一种方言要在一个地区通行,中国版图太大,因而,同为中国

期刊

现代汉语方言方言区陈伯达叶水语言大师闽南话吴侬软语音辞篇外国友人乡言解颐

基于按需路由的MPRN多播算法

文章提出了采用按需路由发现策略的移动分组无线网多播路由算法。在算法中不需要维护全局的路由信息，通过按需路由发现过程，动态更新路由信息和建立多播转发组。多播数据包在转

期刊

按需路由MPRN多播算法移动分组无线网转发群组通信网络无线通信Mobile Packet Radio NetworkingMulticast al

微弱光信号检测

光功率计只能检测单通道信号，通过数字滤波系统不仅可以实现多通道同时检测弱光信号，而且较硬件电路检测来说灵活性高，检测精度也可以和进口设备相媲美。

期刊

微弱光信号检测窄带滤波数据采集光电转换Narrowband filteringDigital collectingCorrelation exami

中药治疗腰椎间盘突出症的实验研究概况

近年来中药治疗腰椎间盘突出症的文献资料表明单独或综合应用于腰椎间盘突出症的治疗，均有一定疗效。广大研究人员对治疗腰椎间盘突出症的中药进行了大量的实验研究，现将其研究

期刊

腰椎间盘突出症中药治疗实验研究文献资料研究人员

谈良好习惯的培养

良好的习惯就如我们呼吸的空气、饮用的水一样不可缺少。没有空气,孩子们会窒息;没有水,孩子们会干渴,那么没有良好的习惯。孩子们会营养不良,更不会成为德、智、体、美、劳

期刊

良好习惯培养自我约束

支持向量机在机械故障诊断中的应用研究

在机械故障诊断中，通常不具备有大量的故障样本，因此，制约了故障诊断技术向智能化方向发展，而基于统计学习理论（SLT）的支持向量机（SVM）方法正好克服了这方面的不足，统计学习理论是专门

期刊

支持向量机械故障诊断统计学习理论机器学习算法Statistical Learning Theory(SLT)Support Vector Machin

软件可靠性的模糊综合评估模型

文章通过对软件可靠性因素的定义和分析，提出了软件可靠性的综合评估指标体系，在计算机可靠性因素对软件可靠性影响程度的基础上，实现了软件可靠性的定性评估，该模型改变了通常把

期刊

软件可靠性模糊综合评估模型软件开发模糊数学Fuzzy comprehensive evaluationSoftware reliability eva

虹膜识别系统的研究

介绍了基于人眼虹膜的一种生物识别技术，描述了虹膜识别系统的组成结构与实现，给出每部分组成模块，并详细讨论了虹膜识别算法。

期刊

虹膜识别系统虹膜定位GABOR滤波器模式匹配图像预处理图像识别计算机iris recognitioniris locationGabor fi

文档识别中误切分字符拒识问题的研究

与本文相关的学术论文