基于深度学习的复杂场景下船牌文字的检测和识别

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:wahahabookbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
船舶的检测和身份识别是港口智能化管理的重要一环,旨在掌握港口进出船舶信息,为通航评估,打击非法停泊、非法出港等违规现象,确保港口交通安全提供支持。在港口摄像头监控场景下,基于图像分析的船牌检测和识别技术成为实现船舶身份识别的重要手段。图像分析技术在车牌检测识别领域已比较成熟,然而由于船牌背景复杂、文本复杂多样、字符排列不规范、字体类型不统一等因素,图像分析技术在船牌的文本检测和识别领域仍面临着严峻的挑战。在此背景下,本文提出一种复杂背景下基于深度学习的船牌文本检测和识别系统SP-TDC(Ship Plate Text Detection and Recognition)。为避免图像中的复杂背景和噪音影响船牌文本检测识别的准确率,先采用改进的YOLO(You Only Look Once)检测算法检测船舶目标,缩小检测范围;针对船牌文本复杂多样、排列不规范给船牌文本检测带来的挑战,提出来一种基于全卷积神经网络的文本检测算法TDNet(Text Detection Network);针对船牌字符差异大、字体类型不统一给船牌文本识别带来的挑战,提出一种在线自适应网络结构TCNet(Text Classification Network),实现船牌文本的分类识别;为加快检测效率,采用特征共享策略将TDNet和TCNet结合为端到端的神经网络结构TDCNet(Text Detection and Classification Network)。在SP-TDC系统中,通过摄像头获取监控视频流,然后解码生成连续的图像帧,并进行船舶目标检测,截取船舶区域;在船舶区域中通过TDCNet进行船牌文本的检测和识别。实验表明,本文提出的基于深度学习的船牌文本检测和识别系统SP-TDC可以连续的处理港口监控摄像头下的视频数据,具有良好的自适应性、较高的准确率和处理速度。
其他文献
通过对六氟化硫(SF_6)分解组分特征气体的在线检测,可以初步诊断SF_6气体绝缘设备早期的绝缘故障。目前的检测方法中比较有效是气体传感器技术。本文将基于石墨烯、聚苯胺等材料的新型气敏传感器,引入到SF_6气体绝缘设备故障分解组分气体的检测研究中,利用自主搭建的动态配气检测装置测试不同传感器对硫化氢(H_2S)气体的气敏特性,并基于复合材料间的异质结等角度研究分析传感材料的气敏传感机理。针对SF_
随着信息时代的飞速发展,互联网上的信息呈指数倍增长,如何高效地从众多互联网信息中获取人们所需要的信息,是目前急需解决的问题。机器学习领域的网页分类技术可以对网页进行分类归纳,帮助人们有效地提取和利用互联网上的海量信息。在众多网页分类算法中,基于支持向量机的多示例多标签学习框架因其出色的学习能力,成为机器学习领域的一个研究热点。本文介绍了网页分类的流程、相关技术,阐述了多示例多标签学习框架和支持向量
肺癌是世界上发病率与死亡率增长速度最快的肿瘤疾病之一,70%~80%的肺癌病人一经发现多属中晚期,此时多数患者的病变部分已无法手术切除,虽然可通过放疗和各种化疗方案进行治疗,但晚期肺癌的预后极差,平均生存时间少于12个月。因此,早期发现肺部病变以提高完全切除率(ROI切除),对于提高肺癌患者存活率意义重大。计算机辅助诊断系统(CADe)的应用很大的提高了早期结节诊出率。但由于现有的传统的CADe方
现实生活中,人们面临的绝大多数的优化问题都可以归类为多目标优化问题。单目标优化可以找到唯一的最优可行解,与单目标优化不同的是,多目标优化问题需要在一组Pareto解集中,找到可以使各个子目标尽可能达到最优的解集,在各个子目标之间保持平衡。粒子群优化算法作为一种群智能算法,因形式简洁,参数设置灵活,操作简便易行,快速收敛的同时能一次产生多个解,从而在求解多目标优化问题中被广泛应用。但是,也存在收敛速
在以信息技术为代表的科学技术迅猛发展的潮流下,自动化设备正朝着响应快、精度高的方向发展。多轴自动化设备在运行过程中,会产生单轴运动的跟踪误差和多轴联动的轮廓误差,这两种误差尤其是轮廓误差直接影响了设备的运动轨迹。轮廓误差是衡量多轴进给系统高精度高速加工性能的重要指标,如何在面向大曲率快速的连续轨迹运动中保持着微小的轮廓误差是当前多轴运动控制系统中亟待解决的难题。轮廓误差控制一直是高精度高速加工系统
随着国内互联网的崛起,计算机网络之间的通信已经成为当今社会必不可少的一个环节。互联网的发展给人们生活以及工作带来了极大的便利,同时,信息安全问题也随之暴露。木马则是危害网络通信安全最大的隐患之一,运用木马技术对网络系统进行入侵是黑客最为常用的手段,以此来窃取个人和企业的关键信息,破坏网络资源,对人们的生产生活等各个方面造成严重的危害。因此,对木马程序进行深入的研究有助于改进木马的检测方法,对防范木
视频字幕生成技术是利用计算机模型为视频中的特定目标和场景生成相应文本标注的技术。它涉及到对物体、人物、场景、事件、时间关系和其他许多方面的理解。最近几年,国内外的研究方法主要集中在将注意力机制施加在不同模态上并将这些模态在同一层次上进行融合。然而,此类方法在融合的过程中并没有考虑具体模态之间的区别和联系。本文围绕解决模态融合不完善和不同模态特征表述不精良等核心问题,提出了一种基于层次型注意力的模态
复杂网络是许多现实网络的抽象,交通运输网、电力网、因特网等各种现实网络均可借助复杂网络理论来研究。网络的拥塞控制算法是影响复杂网络性能的主要因素。目前,现有的拥塞控制算法均认为网络负载为均一的,忽略了现实网络中负载的差异性,如交通运输网络中存在的机动车、非机动车、行人等。即现有的拥塞控制算法无法满足这些差异性负载的传输要求,现存的网络流量模型亦无法对其进行表征。针对这些问题,本文将同一网络中不同性
随着计算机技术的飞速发展,计算机网络已经在人们的生活中无处不在,但网络安全的问题却日益严重。主动网络防御技术作为一种流行的防御技术起着至关重要的作用,而端信息跳扩混合技术是其组成的一部分。端信息跳扩混合技术是一种在端到端的数据传输中动态的改变端信息,将跳变策略和同步策略相分离实现端信息高速跳变的主动防御技术。文件传输作为用户之间数据共享的方式在生活中有着广泛的应用,为了避免文件内容的泄露,传统的方
近年来,随着网络技术应用的成熟,Web服务因其系统开放和结构灵活的特点,得到了飞速地发展。在网络环境中,存在着大量功能相近、属性各异的Web服务实体。而网络化软件正是由分布在互联网上多源异构的Web服务所构成。受Web服务所处动态、开放网络环境的影响,Web服务的可信性处在不断的变化之中。因此,如何构建一个具有动态适应性的可信评估方法,以便于进行Web服务选择与推荐,是当前行业内亟需解决的一个问题