纹理特征加权融合的中亚多文种文档图像文种识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:a410539939
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球各地目前使用很多种相似的文种,相似文种的识别是模式识别领域内难点并迫切需要解决的问题之一。然而,针对中亚文种文本文档和少数民族文种也就是相似文种分类识别方面的文献报道几乎没有。首先建立了两个多文种文档图像数据库,分别有1 600幅和2 200幅纯文本整篇文档图像,包含英文,汉文,俄文,蒙文,阿拉伯文,藏文,维吾尔文,土耳其文,乌兹别克文,塔吉克文和哈萨克文等共有11种文档图像。其次分别提取文档图像的均值,标准差,熵,一致性,三阶矩,平滑度等六个纹理特征,利用不同7种分类器分类。在找到各个特征对多文种文本文档图像的灵敏度的基础上,采用加权特征融合方法提取融合特征,确定了适合中亚多文种文档图像识别的最佳权值。最后用不同分类器分类识别,通过多特征以系数加权融合之后,以建立的两个数据库基础下获得平均的识别率分别为99.38%和95.69%。实验结果表明,提取的纹理特征和加权融合的纹理特征能较好地描述文档图像特征,并且它们可以有效地分类以上所述的11个文种。
其他文献
目的研究联合尾状叶切除的半肝切除术的合理性和可行性,并探讨其适应证。方法回顾性分析31例联合部分或全部尾状叶切除的半肝切除术病例,其中原发性肝癌16例、肝转移癌1例、
当前竞争之激烈,除了血腥味之外,几乎与狼一直生存的环境没有太大的不同。大到商道,小到职场,竞争几乎是每一个人必须要经历的一段路,要走好这段路,不是一件容易的事情。我们
当前,广播电视业得到了迅速的发展,已经进入千家万户,同时,为了满足广大电视媒体用户的需求,需要制作大量的媒体资料,这些主要包括各类视频和音频类的节目,而这些资料在一起
目的:探讨临床路径对关节镜下治疗肩关节Bankart损伤复发性前向不稳患者术后康复的影响。方法:将58例术后肩关节Bankart损伤复发性前向不稳患者随机分为观察组29例和对照组29
简述大巴沟隧道工程的概况及确保隧道工程质量的监控措施。
随着社会经济的蓬勃发展,财务预算管理对一个企业的发展起着至关重要的作用。财务预算管理是对企业的融资、生产经营以及利润目标进行全面预算,并通过一些手段进行合理有效的
目的探讨甲状腺素(TH)水平对H—rasl2V转基因肝癌小鼠肝肿瘤的影响。方法将45只H—rasl2V转基因肝癌小鼠随机分为甲状腺机能亢进症组、甲状腺机能减退症组和对照组,分别给予甲状
21世纪进入了"银发浪潮"时代,老年人问题已不再是一个单纯、简单的社会问题,而是一个遍及世界各国的复杂问题.研究老年人力资源保护的法律法规,探索老年人力资源开发的有效对
文章主要对目前人工种植的苹果采摘的现状进行了分析,并对比目前市场上已经出现的采摘工具,分析了其中的不足和弊端。从而确定了本作品的设计目标和总体方案。文章还对装置的零
常规肿瘤治疗包含了化疗、放疗和手术治疗等方式。在抗肿瘤治疗的同时,心血管毒副反应,如心肌缺血、心功能不全等日益受到重视。不同的治疗方法有着不同的机理和多种毒副反应