基于轻量级CNN的自然场景文本检测和识别算法研究及其实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:proudboy_linux_wzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字,是人们日常生活中主要的信息来源之一。文本检测和识别技术,一直是计算机视觉领域的重要研究内容。自然场景文本由于背景复杂、文本格式多样、成像条件不确定,处理难度较大。基于深度学习的场景文本检测和识别算法凭借良好的鲁棒性和泛化性,被广泛应用于智能交通系统、票据证件识别等场景。但是,主流的场景文本检测和识别模型结构复杂、参数量大,难以在资源有限的嵌入式平台部署。在上述背景下,本文研究并设计了轻量级场景文本检测和识别算法,在成本低、功耗低、算力有限的嵌入式平台实现部署。本文研究了轻量级场景文本检测算法,用于检测多向四边形文本。特征提取层获取图像的特征信息,特征融合层融合多尺度特征,预测层使用像素级的文本/非文本预测,后处理从二值化文本概率图中提取文本框。在ICDAR2015数据集上进行对比实验,在MSRA-TD500数据集上进一步验证模型性能。与基准模型相比,本文研究的算法在较小的性能损失下,模型大小降低为原来的4%左右,帧率提高了 46%-69%左右。本文研究了轻量级场景文本识别算法,用于识别水平矩形文本。特征提取层获取文本的视觉特征,序列建模层获取文本序列的上下文特征,基于CTC算法的预测层使用最大后验概率得到识别的文本。在多个数据集上进行对比实验,验证模型性能。与基准模型相比,本文研究的算法在较小的性能损失下,兼顾了实时性,模型大小降低为原来的4%左右。本文设计了嵌入式场景文本检测识别系统。在车牌数据集上训练模型,OpenVINO模型优化器负责模型转换和模型量化。模型部署到嵌入式系统-树莓派,OpenVINO推理引擎驱动NCS2实现硬件加速。算法中透视变换用于矫正倾斜文本,连接本文设计的文本检测和文本识别模块。经测试,嵌入式场景文本检测识别系统运行帧率约为3FPS,对不同拍摄角度和距离具有一定的鲁棒性,准确率较高,适用于停车场卡口的车牌识别。
其他文献
固体氧化物燃料电池(SOFC)作为一种高效环保的能源转换装置,在近年来获得了广泛的关注。然而,SOFC通常使用氧离子导电陶瓷作为电解质,需要在较高的温度(通常高于800℃)下才能获得足够的离子导电率,这加速了燃料电池的性能衰减,也对燃料电池的材料选择提出了严苛的要求,从而阻碍了其商业化进程。解决策略之一在于将SOFC的电解质材料替换为质子导电陶瓷,由此可将工作温度降低至中温区(450~700℃),
学位
高分辨率视频在生活娱乐、视频监控、医疗等多个领域有着非常大的需求,然而受网络带宽、成像系统等因素的限制,大量视频只能以低分辨率的形式呈现。为了解决该问题,视频超分辨率技术得到了广泛的研究。随着深度学习的快速发展,基于深度学习的视频超分辨率算法表现出了优异的性能。本文针对如何有效处理视频信息的时空域特征这一问题开展了深入研究,提出了基于循环神经网络的视频超分辨率算法,并在特征传播、特征聚合、特征重建
学位
目的 以7A65高强度铝合金为研究对象,研究喷丸强度、弹丸介质(铸钢丸和陶瓷丸)对靶材疲劳性能的影响规律。方法 利用扫描电镜、激光共聚焦显微镜、X射线衍射仪等仪器表征喷丸强化7A65铝合金表面完整性和疲劳失效断口,分析喷丸工艺参数与疲劳性能、断裂模式的相关性。结果 喷丸强化后铝合金表面粗糙化严重,表面粗糙度从初始0.622 μm增加至4.736 μm(铸钢丸、喷丸强度为0.22 mmA),并出现褶
期刊
网络平台中视频数据的爆发式增长促进了视频理解的广泛应用。视频数据不仅包含静态图像,还包含这些静态图像之间的时序关联信息,对视频行为的准确识别需要有效提取并融合这些信息。目前的视频行为识别方法在提取并融合时间信息和空间信息获得时空信息、对时空特征远程依赖的高效建模以及利用短期运动信息增强模型时空建模能力等方面还存在不足,影响了视频行为识别的准确率。针对目前视频行为识别技术存在的上述问题及其在驾驶行为
学位
细粒度图像检索是图像检索领域中具有广阔前景的课题,可应用于电商图像搜索、科研动植物图像搜索等领域。随着深度学习在计算机视觉上的成功应用,出现了许多基于深度学习的细粒度图像检索算法,但这些算法忽略了部分局部细节信息,导致了检索性能瓶颈。本文面向该问题,对细粒度图像检索方法展开研究,主要工作和贡献如下:(1)针对全局特征对细粒度图像描述不充分,忽略细节信息,造成检索性能瓶颈的问题,设计了一种融合全局与
学位
随着交叉学科的的融合发展,许多能够改变未来生活的新兴应用如软体机器人、可植入式医疗器件和可穿戴功能织物都已出现。此时,传统块体电子设备的灵活性和稳定性已经难以满足新兴领域的应用需求,严重制约了电子器件领域的发展。因此,诸多电子器件的结构已从刚性的三维(3D)块体材料发展到柔性的二维(2D)薄膜,最后发展到超柔性、可拉伸的一维(1D)纤维。与2D薄膜和3D块体相比,纤维电极在弯曲刚度方面能够与超软的
学位
氢气具有能量密度高、清洁无污染等优点,是传统化石燃料的理想替代品。电解水制氢将可再生能源产生的电能转化为化学能,是一种有前景的制氢方法。开发高效稳定的析氢催化剂来耦合性能优异的析氧催化剂在碱性条件下电解水产氢具有重要的现实意义。其中,由于镍基催化剂析氢活性相对较高、储量丰富等优点而被广泛研究。然而,镍基催化剂在长期析氢过程中氢化物的形成会导致其性能衰退。因此,有必要解决镍基催化剂在长期析氢过程中的
学位
过渡金属碳酸盐(TMCO3,TM=Fe、Co和Mn等)材料由于其高的储锂比容量,以及制备工艺简单、材料绿色环保且低成本等优点,被认为下一代高能量密度锂离子电池理想的负极材料之一。但是,碳酸盐基负极材料在电化学储锂过程中存在不可逆容量高、体积变化剧烈、材料易粉化等问题,导致其差的循环稳定性和倍率性能。针对以上问题,本论文以碳酸铁(FeCO3)负极材料作为研究对象,探索其合成工艺,进一步选取具有高导电
学位
目的 研究不同厚度的7050-T7451铝合金板材疲劳性能表现出的厚度效应。方法 试验件从3种厚度规格(75、150、203mm)板材的不同厚度位置取样,采用成组试验法进行3级应力–疲劳试验。分析试验数据,发现并总结材料疲劳性能随板材厚度及取样厚度位置变化的演化规律。结果 所有厚度规格板材的表面层材料的疲劳性能均为最优,且不同厚度规格板材表面层材料的疲劳性能差异较小。当板材的厚度较薄(75 mm)
期刊
人类社会的迅猛发展提高了对大规模储能系统的需求,虽然锂离子电池具有较高的能量密度,但是由于锂资源的逐步稀缺和成本的提高,亟需发展下一代储能电池来实现大规模储能系统的应用。钾离子电池凭借储备丰富,价格低廉,与锂离子电池具有相似的工作原理等优势成为未来大规模储能设备的有利候选者。然而由于钾离子半径较大,动力学迟滞,电极体积膨胀大以及电池能量密度较低等问题,严重影响了其商业化进程。近年来,人们通过对负极
学位