【摘 要】
:
随着深度学习技术的爆发,计算机视觉研究已经发生了极大的变化。作为计算机视觉研究领域的一个重要分支,文字检测和识别同样受到了这一波技术革新浪潮的影响。近年来,该研究
论文部分内容阅读
随着深度学习技术的爆发,计算机视觉研究已经发生了极大的变化。作为计算机视觉研究领域的一个重要分支,文字检测和识别同样受到了这一波技术革新浪潮的影响。近年来,该研究领域出现了大量基于深度学习的研究方法提高了相关基准数据集的精度。同时这项研究在当今时代的商业领域亦存在巨大的商业价值。但是,现如今一些常见的算法往往有其局限性,在特定场景下的精度和速度之间难以达到平衡。因此,考虑到文字检测和识别算法在实际生产环境中具有实际的应用价值,但是大多数算法在实际生产中并不能直接应用。针对这个问题,本文从文字检测算法和训练数据集两个方面入手,提出了新的解决方案:1、分析了近年来常见文字检测算法的局限性,并提出了一种新型文字检测算法,该算法在有效提升文字检测精度的同时具有较快的推理速度;2、另一方面,为了解决文字检测和识别在自然文档场景文字识别项目中具有高精度人工标注数据集采集难,样本量少的问题,本文设计了一个合成数据生成引擎,该生成引擎能够在线生成具有文字标注信息的图像样本。基于该数据生成引擎,本文制作了一个具有20,000张精细标注的合成自然场景文档样本数据集SynthDoc20K,该合成数据集的引入有效提升了文字检测和识别算法在自然文档场景下的准确率。
其他文献
黄金价格持续低位震荡,黄金矿山盈利空间大幅压缩,亏损风险增大,面临着巨大的生存压力。因此,在黄金资源的品质基本稳定,没有较大提升空间的情况下,控制成本就成为黄金矿山的
文字作为人与人交流或人与物体交互的重要形式之一,是一种能够提供信息的重要元素。近年来,从场景中检测识别文字已经成为热点研究方向,其目的是将场景中的文本图像通过算法
国内比特币交易所的清退正式进入倒计时。比特币中国近日宣布关闭数字资产和人民币充值功能,此前多家虚拟货币交易平台先后宣布,近期将停止所有虚拟货币交易业务。值得注意的是
研究发现,当今许多高等学校校园活动的现状远远不能令人满意,针对此现象,主要研究大学生参与校园活动的影响因素,致力于打造校园精品活动,丰富大学生校园精神文化生活。
移动互联网近年来始终保持高速发展,成为人们工作生活、休闲娱乐等日常生活的重要手段、渠道和场景。互联网巨头和传统媒体纷纷发力移动互联网,以互联网思维推动传统媒体和新
<正>世界卫生组织和联合国儿童基金会发起的"婴幼儿喂养全球战略"中明确提出了婴儿应保证6个月内进行纯母乳喂养[1]。《中国儿童发展纲要(2011-2020)》也明确提出"0~6个月婴
胶质母细胞瘤(glioblastoma,GBM)是中枢神经系统最具侵袭性的恶性肿瘤,预后极差,平均生存时间只有14个月。目前临床的一线治疗方案是手术最大限度切除肿瘤后联合放疗和(或)替
子宫内膜癌(endometrioid endometrial carcinoma,EEC)是女性生殖系统常见的三大恶性肿瘤之一,是发生于子宫内膜的一种上皮来源的恶性肿瘤,近年来其发病率呈逐年上升。根据临
聚氯乙烯(PVC)和聚偏氟乙烯(PVDF)是目前应用最广泛的两种聚合物多孔膜,但是由于其本身的疏水性使其存在通量低及易污染等缺点,科研工作者们利用各种方法对聚合物多孔膜进行
随着全球经济从金融危机的打击中逐渐复苏,公众对企业的关注重点重新从单一的企业的经济业绩向企业对社会做出的整体贡献转移,将之具体化,就是企业履行社会责任的表现。改革