基于深度学习的旅行证件图像文本识别算法设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lhasrq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旅行证件是各国公民在境外的重要身份凭证,常用的旅行证件包括护照、通行证、身份证等。随着国际往来的日益频繁,对旅行证件表面的文字信息进行高效自动化识别成为边境通关的迫切需要。尽管近年来出现了大量关于文本检测与识别的研究成果,但旅行证件底纹复杂、文本尺度不一与语言多样的特点使得现有的算法难以满足实际需求。针对以上问题,本文提出了针对旅行证件图像的文本检测与识别算法。
  针对旅行证件语言多样、文本尺度不一、底纹背景复杂的问题,本文提出基于多重注意力特征金字塔网络的文本检测算法。通过融合多尺度特征图,提高模型针对多尺度文本的精确率与召回率;通过使用多重注意力模块为特征图进行空间与通道的上下文建模,改善不同语言文本特征的语义紧凑性与一致性,提高文本区域与底纹背景区域的特征区分度,进而提升文本检测模型针对复杂底纹背景下多种语言文本的精确率与召回率。
  针对旅行证件文本图像底纹复杂、字符粘连的问题,本文对文本图像整体进行序列识别,以避免复杂的单字符分割操作。为了提升模型针对文本图像中不同尺度字符的识别率,本文提出一种基于自适应感受野的卷积模块;通过改进连接时序分类,改善字符类别不平衡问题对模型训练的干扰,提升文本识别模型的准确率与泛化能力。
  通过使用实景采集的旅行证件图像与合成图像进行测试与对比实验,验证了本文提出的文本检测与识别算法的可行性与有效性。具体地,本文提出文本检测算法的F1值为0.884,提出文本识别算法的准确率为0.986,高于其他流行方法。
其他文献
索尼VAIO经过十多年的经营,今天已经成为IT领域乃至是时尚领域的潮流风向标,它们的每季发布,都如同高级时尚成衣的Fafion Show。引得全球时尚人士的关注。2009年也不例外。在这一年索尼推出了一系列个性鲜明的产品,包括极致轻薄的VAIO x笔记本电脑、色彩斑斓的VAIO CW笔记本电脑以及一体式触摸电脑VAIO L系列。这一系列产品让沉寂已久的2009年PC行业又焕发了新的生机,它们的诞生
期刊
雾天条件下,空气中存在大量悬浮颗粒,场景的反射光到达成像设备前经过悬浮颗粒发生散射现象从而导致能够到达成像设备的反射光能量减弱,采集到的图像产生严重退化,无法得到有效的远景信息。采集到的降质图像相比清晰图像应用价值大幅减少,给工业生产、安防监控、军事勘测及日常生活等都带来极大影响。因此,提高雾天退化图像的质量,恢复原本的图像信息具有非常重要的理论意义和工业价值。而现有的去雾方法存在着去雾结果失真、去雾不均匀等各种问题,本文在分析雾天图像成像模型及深度学习模型的基础上,将从暗通道先验方法和深度学习方法两个方
人脸图像作为人脸特征的一个重要载体,其分辨率反应了人脸细节的丰富程度。分辨率越高人脸的轮廓越清晰,特征也越明显,有利于对个体的识别,因此高分辨率的人脸图像在安防等领域有着重要的应用。但在实际场景中,由于成像设备的限制、环境的干扰、数据传输的损耗等原因,获得的人脸图像往往质量较差。现有的人脸超分辨率方法对于模拟数据有较好的效果,但对于实际图像其效果并不理想,因此研究人脸图像的超分辨率技术,具有重要的实际价值和理论意义。
  本文针对单帧人脸图像,面向实际的应用场景,从有效特征的提取和网络的构建两个方面
随着社会经济的发展,电力需求容量不断增加,高压电抗器在电网中得到了广泛的应用。以数据为驱动的深度学习在电气设备的故障信号识别应用,克服传统故障信号识别方法的缺陷,对提高电力系统的安全性具有重要的意义。由于高压电抗器的数据价值密度较低,即故障状态下的数据量少,所以利用深度学习对小样本数据进行数据增强,解决了高压电抗器故障信号识别质量不高的问题,成为深度学习在高压电抗器故障信号识别深入研究和发展的关键。
  本文为了研究BKD2-140000/800-110型电抗器故障振动信号识别,解决故障状态下的数据
固执的喜欢老歌、喜欢回忆,2005年王心凌《Honey》大碟的那首同名主打曲,至今仍是我最多哼起的旋律。我会把它放在我的LG新巧克力BL20e上,甜甜蜜蜜、暖心的调子,恰如手机本身名字——“新巧克力”,永恒经典、甜蜜在心。    pm1:27    隆冬时节,选择坐在小店里捧着一杯“卡布奇诺”沐浴暖阳,惬意享受。将LG新15克力BL20e握在掌中,轻轻触碰,“咔哒、咔哒”地翻看其中的种种,甜蜜?幸
期刊
微软ZUNE HD多媒体播放器在中国市场上姗姗来迟,早在几个月前,它已经在国外卖开,受到了众多的时尚潮人所追捧。这么一个小小的多媒体播放器为何那么受欢迎?原因在于它是世界上首款支持1080P全高清播放能力的MP4。不仅如此,高清收音机接收器、全屏互联网浏览、整体发光二极管触摸屏以及Wi-Fi无线网络,这些特性能够将消费者带入一个全新的娱乐世界。    像手机一样的外观    将ZUNE HD拿在手
期刊
随着社会信息化的不断发展,纸质文档的数字化管理是行政办公及各类柜台业务的发展趋势。在金融、教育及消费等领域,平板扫描仪和高拍仪等是常见的图像扫描设备,该类设备成本较高且占用办公面积较大。接触式图像传感器(CIS)具有成像焦距短、结构紧凑和成本较低等优势,适合用于采集纸质文档和纺织品等物体的表面图像。CIS图像扫描系统可集成于打印机和登折机等设备中,为该类设备增加图像扫描功能,从而降低办公设备的总体成本和体积。然而,现有CIS图像扫描系统通过打印机等设备将原始图像数据中转至个人电脑,由于打印机等设备搭载的处
在机场和火车站等场所,利用人证核验系统可以对证件与持证人的身份一致性进行核验,基于计算机视觉技术的智能化人证核验系统可以提升核验的效率与可靠性。在智能化人证核验系统中,图像内的复杂背景会干扰证件区域的准确定位,影响证件信息的自动识读;此外,现有的人脸验证算法不能同时兼容各类证件中不同分辨率的人脸图像。本文对人证核验系统中的证件区域定位及多分辨率人脸验证问题开展研究,并设计和实现了一套人证核验系统。
  首先,针对复杂背景下的证件区域定位问题,本文提出了一种结合卷积神经网络与Canny算子的证件定位方
诺基亚X6采用了主频为433MHz的处理器,搭载最新的S60第五版操作系统配备了3.2英寸1600万色360×640分辨率的触摸屏幕,提供了16:9的宽屏显示效果。在用户界面方面X6优化了用户的图片,视频和浏览体验,在主屏可以添加20位朋友或者Facebook等虚拟社区。该手机在音乐功能上也有出色的表现,32GB大容量存储能够持续播放35个小时的音乐。此外,500万像素的“卡尔·蔡司”自动对焦摄头
期刊
预印刷的产品包装薄膜上没有产品的具体生产信息,因此在产品包装生产线上还需要喷码,喷印的标识包括生产日期、生产地、生产厂商等。由于人为因素或者设备异常情况的影响,喷码可能存在印漏、印错等质量问题,影响产品合格率。传统喷码缺陷检测以人工检测为主,准确率受主观因素影响,且带来很高的用工成本。随着图像处理和计算机技术的不断发展,应用机器视觉方法实现智能质检成为了一种趋势。本文研究喷码缺陷视觉检测关键技术,并完成视觉检测软件系统的研发,主要工作包括:
  第一,针对包装预印刷文本和图案干扰图像配准的问题,提出