基于神经网络的自然场景中的字符识别算法的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:marrymattion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动网络的普及和手机的大量使用,人们从自然场景获取和分享图片的方式越来越多,从海量的自然场景图片中识别出字符变得越来越重要,智慧城市、工业自动化等都需要实时的识别出场景字符。场景字符识别属于文本识别的范围。在传统的识别方法中,往往需要手动去设计特征,鉴于背景的多样化和随意性,这种传统的算法往往满足不了实际的需求。而深度学习技术的快速发展为自然场景中字符检测与识别带来了新的契机。相比于传统的识别方式,神经网络不但可以通过卷积自动提取图像特征,还可避免传统方式中手工设计特征带来的庞大的工作量,因此,使用神经网络进行自然场景字符识别已经成为当前的主要研究方向。当前的自然场景字符识别算法虽然已经取得了很大的进步,但是还存在以下问题:对小目标的检测的效果不好;很难区分粘连的文本;对于弯曲文本,检测和识别效果一直都不好。针对以上问题,本文做了以下几点创新性的改进工作,具体研究工作如下:1、针对小目标检测效果不好的问题,本文结合了基于像素分割的检测方法和形态学中的腐蚀和膨胀算法,通过腐蚀去除无关小目标,再进行膨胀对真正的小目标区域进行扩张,从而能有效的检测出小目标,在Total-Text数据集上的精确率从81.8%提升到了85.1%。2、针对粘连的文本,本文结合了区域扩展算法和可变形卷积,利用可变形卷积从多角度去提取特征,从而提高粘连文本的检出效率。3、对于弯曲文本的检测和识别,在检测时本文结合了文本区域多点标记和区域扩展算法,对弯曲文本有很好的检出率,在CTW1500数据集上的精确率从80.6%提升到了83.2%。4、在识别时结合了CRNN和Attention机制,提升了文本的识别率。
其他文献
5月24日,由武汉公交二公司主办,江汉区文明办、武汉市交通管理局江汉交警大队、西北湖管委会协办的“礼让斑马线文明我率先”活动隆重举行。武汉市交管局车管所副所长金平章为3
近日,深圳市科陆电子科技公司总裁饶陆华、副总裁桂国才一行来到公交大厦,集团董事长余钢,总经理王慧农,监事会主席刘荣志,党委副书记纪志龙,副总经理周志成、范章顺、马正源,财务总
近日,《济南市户外广告和牌匾标识专项规划》(以下简称《规划》)获市政府正式批复,公交年、HI租车等车体将禁止设置商业广告。《规划》根据济南城市中心结构体系,将户外广告分为禁
583路驾驶员“公交大哥”周吉贵爱岗爱家的事迹经楚天都市报报道后,在社会上引起强烈反响。4月13日,集团召开学习宣传周吉贵先进事迹座谈会。
近日,在长治市经信委(国资委)委属监管国有企业单位“三基建设”基础工作评估中,长治公交被评为“优秀”等次。据悉,此次评估工作是根据省委、市委关于推进“两学一做”学习
针对传统协同过滤算法不能及时反应用户的兴趣变化、时效性不足而导致推荐精度不高的问题,提出一种基于用户兴趣和项目属性的协同过滤算法。在传统协同过滤基础上综合考虑评分时间、相似度以及项目属性等因素,首先在计算相似度过程中加入基于时间的用户兴趣度权重函数,然后再与项目属性相似度进行融合,最后进行项目预测与推荐。在Movielens数据集上的实验结果表明,所提出的算法与已有的经典算法相比,平均绝对误差降低
陷入债务困境的国有企业,内部的主要原因是固定资产无效占用资金多、流动负债比重大和经营管理不善。企业面对严峻的债务问题再不能有等靠要思想,应积极行动起来,通过开拓市场盘
产权制度是影响资源配置效率和经济绩效的重要变量。在市场经济中,交易是有费用的、在交易成本不为零的假设下.交易要有效率.交易成本必须低于交易所得。要降低交易成本.产权必须
目的调查某企业周边环境大气和土壤中的铅浓度并进行分析和评价。方法在某企业周边设置4个监测点采集空气和土壤样品,分别测定铅的浓度。采用非参数秩和检验进行时空分析,运
为进一步提升重庆公交驾驶员综合职业技能,为广大市民提供更加安全优质的服务,集团于2016年12月10日-16日举办了2016年“安康杯”重庆公交客车驾驶员职业技能竞赛。重庆市总工