【摘 要】
:
随着移动终端尤其是具有拍照功能的智能手机广泛普及,使得人们能够轻易地捕获海量的自然场景图像。同时,伴随着深度学习和计算机视觉的飞速发展,自然场景文本定位与识别以及如何将现有神经网络模型经过压缩后移植到移动终端成为近些年的研究热点,这个方向的研究具有重要的理论意义和广泛的应用前景。本文以自然场景为研究背景,围绕如何从自然场景中高效地识别文本信息以及深度神经网络模型压缩展开研究,设计并实现了基于移动终
论文部分内容阅读
随着移动终端尤其是具有拍照功能的智能手机广泛普及,使得人们能够轻易地捕获海量的自然场景图像。同时,伴随着深度学习和计算机视觉的飞速发展,自然场景文本定位与识别以及如何将现有神经网络模型经过压缩后移植到移动终端成为近些年的研究热点,这个方向的研究具有重要的理论意义和广泛的应用前景。本文以自然场景为研究背景,围绕如何从自然场景中高效地识别文本信息以及深度神经网络模型压缩展开研究,设计并实现了基于移动终端的自然场景文本识别系统。论文的主要内容如下:(1)在自然场景文本定位中,从目标检测问题出发,在研究和总结现阶段存在的优秀文本定位算法之后,本文设计了一种基于YOLO v3结构的文本定位算法,并与现有的CTPN算法进行了实验对比,实验结果表明YOLO算法在推理耗时-上比CTPN算法大幅减少,但在场景文本定位精度上前者比后者差。(2)针对自然场景文本识别问题,文本分析了一种由CNN和RNN组成的CRNN文本识别算法,通过模型的预训练及一系列的评价实验,结果表明CRNN在模型尺度较小的情况下能够胜任一般自然场景的文本识别任务。(3)对于深度神经网络模型压缩,本文首先剖析了现有网络模型移植到移动终端难点,随后论述了现阶段关于CNN和RNN压缩方法,并结合CRNN算法进行了模型压缩的实验,结果表明在牺牲一定精度的情况下,压缩后的模型能够满足在移动终端进行实时推理的需求。(4)结合以上三部分研究,本文设计并实现了一种基于移动终端的自然场景文本识别系统。
其他文献
土壤盐分影响氮素的循环过程,而活性氮组分的变化是表征氮素循环的重要指标.本研究以黄河三角洲地区的盐渍化土壤为对象,采用室内好气培养法,设置4个NaCl盐分梯度(S1:0.1%;S2
香豆素类化合物由于其较强的单胺氧化酶-B(MAO-B)抑制活性近年来得到广泛的研究,而MAO-B又是治疗阿尔兹海默症(AD)的一个重要靶点,本文基于AD病的发病机制以及香豆素类单胺氧化酶
<正>博世热力技术事业部与中国知名地产企业融创房地产集团有限公司于近日达成战略合作,共同签署了"2017—2019年度A档燃气热水器集中采购协议"。根据该协议,博世将为融创在
甘肃省是我国重要的马铃薯种薯和商品薯生产基地,马铃薯产业已成为带动甘肃农业和农村经济发展、促进农业增效和提高农民收入的战略性主导产业。本研究针对甘肃中部半干旱地
<正>日前,中国邮政集团公司江西省分公司与顺丰、申通、圆通、中通、汇通、韵达、天天、优速8家快递企业的江西分公司签订战略合作协议,合作方将在22个县区共同推进农村快递
随着现代信息技术的不断革新,互联网及其应用软件和平台得到了快速发展和完善,同时,互联网及其衍生品也逐渐地改变着人们的学习、工作以及生活的方方面面。其中,网购平台的迅
本论文利用1995-1996年NOAA气象卫星的NDVI(1km×1km)数据,采用无监督分类方法对中国东部样带南方部分进行植被类型的划分,分析各植被类型的NDVI变化情况;并利用较高精度的TM数
经济发展要求会计进步,从而带动会计教育事业繁荣。共享经济模式具有估值方式的模糊性、信息技术的颠覆性及会计处理的不确定性等特点,对会计人才的培养提出了严峻的挑战。高
小麦是我国重要的粮食作物之一,提高小麦的产量有助于提高国民的经济水平和生活质量。近年来,随着小麦害虫发生的不断加重,快速而准确的获取害虫数量的动态变化成为迫切需求。麦蜘蛛是小麦害虫的一种,因虫体较小,目前仍使用人工田间目测计数方法。为提高监测田间麦蜘蛛种群数量动态的时效性和准确度,计算机视觉中大量的目标检测方法已经成功应用到农作物虫害的检测中,这些方法具有更加快速、精准、客观、方便等优点,同时大幅
核电厂抓取工具用来完成对操作对象的抓取与释放操作。传统操作工具都需要额外动力或人工执行抓取和释放动作。纯手动方式往往操作比较繁琐,而且存在因误操作造成跌落事故的