基于SSD算法的二维编码图像目标识别

来源 :中国科学院大学(中国科学院上海技术物理研究所) | 被引量 : 1次 | 上传用户:wangyingygp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二维码因具有发布快捷和成本低廉的优势,已经成为互联网时代全新的沟通语言和工具,是信息识别领域的关键技术。但是由于传统二维码不具有人眼识别的语义信息,导致用户的使用感不强,因而涌现了多种改良的技术方案,但在人眼可识读语义信息方面仍未达到最优。因此为实现二维码同时适合机器和人的识读,提出了一种基于图像边缘编码的二维编码图像技术,将编码ID存储于图像的边缘中,使二维码的语义信息达到最大化。由于此方案中二维编码图像无定位标识点,用传统的图像处理技术对其定位识别比较困难。而随着深度学习的发展,计算机视觉得到广泛的应用,其中目标识别具有自动提取目标特征进行定位识别的强大学习能力,使二维编码图像的定位识别得以解决。本文基于深度学习对二维编码图像进行识别与定位的算法开展研究,主要工作如下:(1)提出了基于图像边缘进行编码的二维编码方案。与其它编码方案不同,本次二维编码方案是基于图像边缘百分之十的部分进行编码,将编码ID存储于图像的边缘中,使二维码的语义信息达到最大化,可同时适用于机器和人识别。并且针对后续定位识别问题,设计了完整的二维编码图像编码边框颜色选取方案,选取了每个通道上颜色值在图像边缘区域最少,且在颜色空间上与最多的颜色值不相邻的颜色值作为二维编码图像编码边框的颜色,有利于二维编码图像的定位识别以及后续的编码识别。(2)改进SSD算法使其适用于二维编码图像的定位识别。与QR码等二维码不同,基于图像边缘编码的二维编码图像没有定位标记点,在复杂背景中用传统的图像定位技术定位二维编码图像比较困难,因此提出将深度学习应用到图码结合的二维编码图像这个新技术当中,通过采用改进的SSD算法,利用多尺度特征复用,将二维编码图像从复杂的背景中识别出来。该算法针对小目标的识别特点,去掉了原有的空洞卷积层并选择浅层图层进行特征融合。(3)数据集创建与增广。由于深度学习是建立在大量数据的基础上,本论文提出通过电脑生成相应的数据集,利用生成的数据集去训练网络,通过合成的数据集进行网络测试,最后增加真实的图片做进一步验证。在数据集中,除了旋转粘贴二维编码图像于背景图上所生成的数据集图片,还包括在背景图上直接粘贴无编码的二维图像作为负样本的数据集图片,以及直接在背景图上加入相应的编码部分特征作为正样本的数据集图片,从而增加了网络的适应性和鲁棒性。(4)具体提出了完整的二维编码图像的编码方案,并对二维编码图像进行编码识别。针对改进的SSD算法检测出来的二维编码图像定位结果,按照二维编码图像边框颜色的特点,将其提取出来,进行编码识别。并且使用了真实照片进行测试,对二维编码图像进行识别,完成了基于深度学习的二维编码图像的目标识别任务。
其他文献
海量小基站在无线通信频段逐步走高的时代具有极大的意义,并越来越多地被应用于对信号漏洞的填补以及网络带宽的扩充,而其中自动化的管理海量小基站的功率设置问题为基站管理领域提出了一个挑战。传统中心式的基站管理方法存在周期长,中心节点优化难度大,数据收集分发延迟高等问题,不适合动态性较高的海量小基站场景。最近的基于无中心式地基站功率管理算法基于基站局部观测和有限通信的条件下,解决了中心式管理的一些问题,使
碳纳米点(Carbon nanodots,CNDs)作为一种新型零维碳纳米材料,因具有优异的物理化学性质、生物相容性好等特性,被广泛应用于生物监测、医学、催化等领域。Ni基纳米粒子价格低廉,在催化过程中表现出较高的催化活性。金属纳米粒子与碳纳米点复合后生成的复合纳米体系因在催化中表现出高的催化活性,而被广泛关注。本文提出以碳纳米点作为稳定剂,制备出Ni基双金属/CNDs复合纳米粒子,研究其各方面性
目的:通过冻干法和定向冰冻技术分别制备磷酸八钙/丝素蛋白/海藻酸钠(octacalcium phosphate/silk fibroin/sodium alginate,OCP/SF/SA)复合多孔骨层支架和含硫酸软骨素(hondroitin Sulfate,CS)的CS/SF/SA定向孔软骨层支架;体外实验评估支架的理化性能以及生物学行为,选择合适的骨层以及软骨层材料,构建骨-软骨结构仿生支架,
目的观察针刀联合刺骨术治疗膝骨性关节炎的临床疗效,旨在寻找出一种更加有效的治疗方案。方法遵循纳入排除标准选取60例在2019年1月至2020年1月期间就诊于芜湖市中医医院骨
本文以双音虚词“X且”的词汇化和语法化为研究对象,采用描写与解释、比较与分析等研究方法,通过对语料的全面分析,分别确定每个虚词的成词途径、成词时间,分析各自的语义和语用功能,在此基础上归纳出“X且”词汇化的来源,并依据现有的词汇化和语法化的理论知识分别对“X且”词汇化和语法化的动因和机制进行相应的解释和总结。全文共分为五个部分:第一部分是绪论。说明研究的目的和意义,确定研究的对象和范围。总结研究现
鲍曼通过对大屠杀的反思,对陌生人的分析,对现代性与矛盾性的阐述,对消费者社会的解读,对暴力的隐匿来批判西方社会现实,试图构建“他者”的道德理论。鲍曼认为,随着经济全球化的到来,流动性、非固定性充斥着现代世界的每一个角落,我们每个人的周围充斥着陌生人。现代性下道德冷漠在后现代性下的今天已经扩展到社会日常生活领域,这是极其危险与可怕的。后现代性下,道德是个体化的,短暂的,呈现碎片化的趋势,道德已经脱离
LiNi0.5Co0.2Mn0.3O2(NCM523)三元正极材料具备能量密度高、以及循环性能和安全性好等诸多优点,被认为是一种极具应用前景的锂电池正极材料,但是仍然存在表面结构相变、界面副
自蔡少棠教授于1971年预测了忆阻器的存在以来,由于没有物理器件作为支撑,忆阻器并没有引起人们的注意。直到2008年惠普实验室团队在《自然》杂志上首次报道实物忆阻器的存在,由于它在很多领域的潜在应用,如非易失性存储器、神经形态计算以及忆阻器混沌电路等,忆阻器开始引起全世界人们的广泛关注。忆阻器具有非线性的特性,它的出现为混沌电路或混沌系统的设计开启了一个崭新的大门。基于忆阻器的混沌电路的动力学行为
近年来随着技术的不断进步,红外成像被广泛应用于人脸识别、目标检测和医学诊断等各个领域。但由于复杂背景下存在云杂波等强噪声、实际应用场景中目标成像距离较远和信号在大气中衰减严重等原因,红外目标具有信号弱、成像面积小、形状信息缺失、纹理特征不明显、信噪比较低等特点,同时复杂背景下的人造光源和建筑物等的存在也导致目标检测算法的虚警率较高,这些原因都给红外弱小目标检测算法性能的提升造成了巨大挑战。在实际应
现阶段,随着全苜蓿叶式立交建设周期长、条件复杂、主线交织冲突的问题趋于严重,半苜蓿叶立交逐步成为城市互通立交选型建设的不二之选。半苜蓿叶形互通立交作为四肢部分苜蓿叶形互通立交的一种,不仅具有主要道路畅通、主线标志简化、用地和工程费用较少等优点,而且适合用于主要道路与次要道路相交、地物限制较严或分期修建等情况。对现有城市半苜蓿叶立交来说,大多主线出口匝道的设计方式为单匝道。若想实现互通的功能,车辆需