基于深度学习的自然场景下车牌识别算法研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ydsl_0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能交通系统的不断发展,我国的交通管理也在不断进步,现已有很多城市普及安装了一体化自动识别车牌系统。车牌识别是智能交通重要的一环,往往起决定性作用。车牌识别应用现状主要在固定的条件下进行,如对小区门口进出车辆的车牌识别。随着适用场景范围的扩大,车牌识别技术面临着更多的问题。目前,摄像头拍摄的图像采集技术已经相当成熟了,但当应用场景的需求扩大后,车牌定位和识别技术仍然需要进一步发展。随着人工智能和深度学习领域的高速发展,计算机处理速度和计算机视觉问题都得到了很大突破,同时也给传统的车牌识别技术带来了转变。通过深度学习技术实现车牌检测和识别具有更高的鲁棒性和自适应能力。本文的研究场景是街道路侧停靠车辆的车牌识别,重点更关注高位摄像头下街道自然场景的车牌识别。通过将车牌识别分为车牌检测、车牌矫正和车牌识别三个模块,来完成整个车牌图片的识别。针对本文高位摄像头街道停车识别展开的研究具体内容如下:1.研究了国内车牌的主要特征,通过三个部分数据组合完成车牌的数据集,主要由CCPD大型车牌数据集和采集的街道场景数据集构成,这两部分数据中,存在中文字符分布不均且大部分省份字符文字缺乏的问题。针对这一问题,人工合成车牌数据来增加中文字符比例,缓解中文字符缺乏问题。2.研究了车牌检测的相关技术。根据识别场景需求确定了可行的基于Open CV级联分类器的检测算法和基于YOLOv2改进的检测算法。改进YOLOv2网络使其更加适应单目标检测任务,并添加多尺度融合机制以提升小尺度车牌的检测率。对比分析两种算法,选择表现更优的基于YOLOv2改进的车牌检测方法来实现车牌检测算法。3.对于车牌字符识别方面,采用一阶段式方法实现不定长车牌的识别。本文在CRNN网络和LPRNet网络的基础上,结合这两种网络结构的特点,构建本文的车牌识别网络,以全卷积网络加上CTC的loss函数实现车牌的不定长识别。改进的CNN+CTC网络采用长卷积核代替RNN,简化网络结构,同时使用1*1的卷积核降维到字符类数,可实现输入多尺度图片识别。在性能测试上,改进的网络在识别准确度和速度上取得了较好的平衡,在准确度上高于LPRNet,在速度上快于CRNN,能够满足本文街道场景的需求。对于车牌倾斜造成易识别出错的问题,分析了车牌可能存在的倾斜角度,根据三维空间形变的特点,使用透视变换方法矫正车牌,通过实验验证,矫正算法对综合类型的蓝牌图片能提高4.6%的序列识别准确度。最后,本文整合车牌检测、车牌矫正和车牌识别三种算法,实现完整的车牌识别流程,通过验证整个系统算法的工作流程,证明了其在街道场景识别任务的可行性。
其他文献
任务规划技术在现实生活中应用十分广泛。任务规划算法通常在给定有限的子任务空间下进行子任务安排,进而得到一条可以满足业务需求的任务流程。目前,基于开放性空间的任务规划求解问题成为研究热点。但这类方法因开放性解空间的原因,对于交互性和动态调整性提出了需求,用户需要在任务规划阶段交互式参与解决方案的调整。为此,论文以代码模块组合任务规划为典型场景,将代码模块组合任务规划分解为代码搜索与代码组合两部分,解
随着信息科学技术的发展,图像已经深入人们生活的方方面面,图像中的内容也越来越复杂。多标签分类比单标签分类更能准确的描述图像中的内容,因而得到广大研究者的关注,并成功应用在智能管理相册、自动驾驶、广告推荐和视频监控等领域中。为了进一步提高多标签图像分类的效果,本文提出了基于语义空间注意力机制的多标签图像分类模型和基于语义通道注意力机制的高分辨率分类模型,具体的研究内容如下:(1)提出了基于语义空间注
强化学习作为机器学习领域的重要分支之一,是一种通过在环境中不断试错从而得到最优策略的方法。而得益于深度学习近年来的发展,结合强化学习与深度学习所形成的深度强化学习成为了一个热门的研究领域,并在许多问题上取得了突破性的进展。在深度强化学习算法中,异策略强化学习算法凭借其对样本数据极高的利用率在部分问题上具有显著优势。但是由于真实环境中的控制问题往往极其复杂,获得经验样本的成本非常昂贵,而且现有强化学
近年来,人工智能领域蓬勃发展,同时也存在一些问题和挑战。其中,数据孤岛,用户隐私保护导致的数据割裂问题尤为受到人们的重视。在各行业中,不同机构,同一机构不同部门的数据通常存在屏障,不能被直接共享或交换,表现为数据以“孤岛”的形式存在,这使得大数据驱动的人工智能技术难以充分发挥价值。此外,随着国内外数据隐私保护法规的不断完善,对企业在用户数据的收集、存储和使用环节中提出了高的用户隐私保护要求,这提高
伴随着无线设备的快速发展,现如今越来越多的车辆都配备有大量的无线设备,使利用大规模的车载网络成为了可能,因此,工业界和学术界对车载自组织网络(VANETs)产生了极大地兴趣。车载网络通常会因为车辆的行驶速度快,网络节点间的拓扑结构变化频繁,以及车载无线设备带宽低等问题,导致网络质量不佳。本文采取的解决方案是,利用路侧停放的车辆,将路侧停车加入车辆网络,利用停放的车辆中的无线设备进行网络的数据分发,
针对人工智能实际应用环境中的数据孤岛效应和数据隐私保护,联邦学习框架应运而生。本文研究了基于卷积神经网络的联邦学习算法,主要包括:(a)针对个性化,研究了联邦学习的框架下多个客户端联合训练,最终为每个客户端学习其对应的个性化模型;(b)针对通信瓶颈,研究了联邦学习中的通信压缩。具体的主要研究内容如下:(1)本文提出了基于子类个性化的联邦学习算法(Subclass Personalized Fede
基于会话的推荐系统作为一种有效的技术手段可以帮助用户发现与其当前会话中兴趣相关的物品。与传统推荐系统相比,会话推荐由于能够仅根据在进行的会话期间观察到的用户行为来进行推荐而具有高度实用性,受到研究者的广泛关注。当前研究主要将基于会话的推荐任务建模为根据现有点击序列数据预测用户的下一次点击问题,主要采用基于深度神经网络和表示学习的方法,利用会话中的物品点击序列提取与用户兴趣相关的特征,生成用户最可能
Spiking神经网络(SNN),作为第三代人工神经网络(ANN),模拟了大脑中神经元的信息处理方式,具有高度的仿生性和生物可解释性。相比于第一代ANN(使用M-P模型作为网络的计算单元)和第二代ANN(通过非线性的激活函数来处理线性不可分问题),SNN因为其独特的信息编码和处理的方式,具有更强大的计算能力。但是目前常见的SNN模型在计算上都非常复杂,不利于网络模型的扩展,而且也缺乏比较高效的算法
随着深度学习方法的不断突破,计算机辅助诊断技术在医学影像分析领域得到越来越多的发展。医学影像分析作为计算机辅助诊断技术的关键,其依赖的是基于图像处理技术的深度学习方法,本文涉及的膀胱镜肿瘤影像分析更是依赖基于深度卷积神经网络的多目标检测方法。但膀胱镜检影像样本和标签数量无法摆脱欠缺的问题,面临着小样本场景下的膀胱肿瘤感知技术难题。本文立足于深度卷积神经网络,从小样本场景的多目标分类和检测着手,重点
近年来,深度神经网络模型已经能在各种分类任务中达到很高的准确率,然而最近的研究表明,深度神经网络容易受到对抗样本的攻击,攻击者只需在干净样本中添加一些人眼无法识别的微小扰动,就可以生成对抗样本,从而轻易地使深度神经网络模型对其产生错误分类,随着深度神经网络广泛应用于各个领域,对抗样本使这些深度神经网络系统面临巨大的安全威胁。因此,为了减少对抗样本对神经网络的影响,提高神经网络的鲁棒性,对深度神经网