【摘 要】
:
伴随着信息技术的飞速发展,在数字图像处理领域,目标检测与识别已经是近年来的研究热点之一。通用目标检测算法已经取得了长足的进展,然而在具体应用场景中,由于环境的变化、目标的尺度、视角等变化,通用目标检测算法未必有效,比如:行车拍摄的交通标志往往尺寸较小、种类繁多;航拍图像中的目标方向各异、尺度变化悬殊;自然场景中的文字形状奇异、包罗万象。这三类特殊的目标,相对于当前用于目标检测的流行数据集,其特点是
论文部分内容阅读
伴随着信息技术的飞速发展,在数字图像处理领域,目标检测与识别已经是近年来的研究热点之一。通用目标检测算法已经取得了长足的进展,然而在具体应用场景中,由于环境的变化、目标的尺度、视角等变化,通用目标检测算法未必有效,比如:行车拍摄的交通标志往往尺寸较小、种类繁多;航拍图像中的目标方向各异、尺度变化悬殊;自然场景中的文字形状奇异、包罗万象。这三类特殊的目标,相对于当前用于目标检测的流行数据集,其特点是目标处于开放环境中,小目标居多(目标尺寸小于32 × 32的交通标志或文本短边小于24像素),目标的尺度、形状等差异性大。因此,现有的通用目标检测方法的性能不理想,需要研究这类特殊小目标的目标检测识别方法。本文围绕交通标志、航拍目标、场景文字三种复杂场景下的目标检测问题展开深入研究,根据不同的场景设计出具有针对性的小目标检测与识别算法。研究内容和主要贡献包括以下几个方面:第一,提出了一种针对交通标志检测识别分而治之的卷积神经网络。本文充分分析了二阶段检测方法的不足以及交通标志的特点,将检测任务与识别任务分离为两个子任务。针对识别难于检测问题,改进了 Faster R-CNN作为检测子网络,利用精简的主干网络和细致的锚点,在不失检测率的情况下提高了目标的检测速度。提出了大尺度的识别子网络,通过与检测子网络共享部分卷积参数、大尺度感兴趣区域池化,保留了目标丰富的浅层特征,使其能够胜任两百多类的细分类任务。在这种分离结构的基础上,本文还设计了多批量训练框架,大大提升了框架的识别性能。该算法在TT100K与CTSD两个数据集精度分别达到了 93%和98.32%,召回率分别达到了 94%和98.70%,速度可达10.25FPS。第二,提出了一种级联的多方向航拍目标检测算法。该算法借鉴了 Cascade R-CNN级联定位目标边界的思想,设计了一个多信息级联输出端。利用目标定位过程中任务的难易变化以及目标标注信息的丰富性,通过逐级定位的思想实现目标多方向边界框的定位。针对航拍目标颜色特征相似问题,利用定位得到的位置信息提取目标形状特征,结合目标纹理颜色特征提出了级联分类器,通过由细入精的识别步骤对目标进行有效地分类。并且,针对训练样本不平衡问题提出了匮乏样本扩充方案。该算法在DOTA、HRSC2016两个航拍数据集上mAP分别达到了 72.81%和89.68%,超越了当前其他算法。第三,提出了基于剪枝与知识蒸馏的快速场景文本检测算法。该算法针对现有方法参数冗余,速度较慢等问题,在DBNet框架下,根据BN层参数中缩放因子的大小裁剪基准方法主干网络,得到一个快速的文本检测网络。此外,该算法利用了知识蒸馏的思想,用一个性能优异的教师网络辅助训练剪枝后的精简网络,使得网络兼顾了速度与检测性能。该算法在Total-Text、MSRA-TD500和ICDAR2015三个场景文本数据集上进行验证,综合得分分别达到了 83.3%、83.4%、82.8%,最快速度可达实验表明95FPS,其性能均超越了大多数其他方法。
其他文献
截至2019年4月,我国年度的货物吞吐量已经累计143亿吨,比上年增长2.5%,全球货物吞吐量排名前十的港口中七个在中国,由此可见,港口每年的业务量非常巨大。在高强度工做压力下,港口设备各个机构的零部件需要定期的维保和检测,因此维保和零部件的供给速度是港口设备运行效率的重要要素。随着科学技术的不断发展,港口设备正朝着大型化,复杂化,自动化发展,如何运用先进的管理理念和方法对港口设备维保所需的备件进
高铁涂装是高铁生产制造中的重要工艺,其表面喷涂质量的好坏决定了高铁车体的寿命和性能。由于车体本身体积庞大且对喷涂质量要求高,目前国内的白车身喷涂车间主要由人工来完成,在喷涂工艺环节和喷涂质量的控制方面还大多依赖于工人的经验和熟练程度。机器人喷涂因其低成本、高灵活性越发受到各大厂商的青睐,但是对于喷涂工艺过程研究的不成熟导致了喷涂质量常常难以控制,这也是阻碍其广泛应用的原因所在。因此为了提高喷涂效率
农业保险是管理现代农业风险的有效工具,近年来中央政府重视农业保险发展,不断提高农业保险保费补贴金额,那么保费补贴的效果如何,影响因素有哪些,这些问题受到广泛关注。因此,对农业保险保费补贴进行效果评价并进行因素分析,是完善我国农业保险的重要依据,对实现农业保险高质量发展具有现实意义。本文在分析保费补贴动因、保费补贴功能的基础上,结合农业保险保费补贴的作用机制,从经济效益、社会效益和补贴效率三方面建立
在互联网技术飞速发展和经济全球化的今天,中小型企业也开始参与全球一体化的贸易中,全球贸易带来的普慧益处是所有外贸企业的共同追求,全球贸易的格局已经形成。在“互联网+外贸”的新型贸易形式下,全世界的产业分工和贸易条约都随之改变。跨境电商零售进口作为一种贸易方式,也随着互联网经济的发展而逐渐受到重视,让消费者与全球的商品直接接触,对进口产业的影响巨大。在贸易增长、消费者的意愿选择、带动就业方面,我国跨
自发拉曼光谱作为一种物质分析的方法,具有检测范围广,单一光源能够同时检测多种组分等优点。拉曼散射强度线性依赖于待测样品的分子数,气体由于密度比液体和固体小,其自发拉曼信号十分微弱。为此,人们致力于寻找增强自发拉曼的方法。空芯光纤是其中最具优势的一种器件,既能够充当气体样品室,又能增加散射光的收集效率,带来拉曼散射信号的显著增强。反谐振空芯光纤是一种前沿的微结构空芯光纤,具有传输损耗低和传输范围宽等
阻变存储器是为了解决浮栅存储器尺寸的不断缩小引发的一系列问题而兴起的一种非易失性存储器,它结构简单、尺寸可缩小性好、存储密度大、操作电压低,目前已经成为了存储行业的研发重点。本文基于固态电解质材料LATP和传统二元氧化物HfO2,根据阻变存储器件已有的单极性和双极性阻变特性提出了一种新的阻变特性。这种阻变特性既包含了传统的单极性和双极性阻变特性,也包含它们之间稳定的相互转换,称为任意极性阻变特性。
量子干涉效应为纳米尺度的电荷传输提供了独特的机会,已经成为分子电子学的一个新兴领域。由于粒子间存在量子干涉,可以通过结构的转变和环境变化来控制电子通过分子内部的传输,这可能将导致各种电荷传输状态从导电状态转变为绝缘状态,并在未来的功能单分子器件中提供有前景的应用。特别是对于具有相消量子干涉效应的分子,由于具有相消量子干涉效应分子的超低导性,利用电化学调控将其转变成相长量子干涉效应的分子可使其单个分
3D NAND闪存凭借其存储密度高、成本竞争力强、读写速度快等优势成为目前电子设备中的主流数据存储介质。工业领域和航天航空领域等对3D NAND高低温下的可靠性有着严苛的要求,3D NAND在单元结构、阵列架构以及制造工艺存在较大差异,使得3D NAND在高低温下的表现参差不齐。因此研究3D NAND闪存芯片在高低温下的可靠性具有十分重要的现实意义与应用价值。本文为了研究3D NAND在高低温下的
税务部门是政府与纳税人之间的沟通桥梁和纽带,其所提供的服务具有公共服务属性,而纳税人是税务部门的顾客。因此,基于顾客满意的服务质量理论探索纳税人感知的税务部门提供的服务是一个可行合理的路径。本文从纳税人感知的纳税服务满意度测评出发,阐述了选题背景、研究意义。根据文献分析纳税人满意度的内涵和满意度测量的方法,从而构建了纳税服务满意度的理论基础。在以HJ县税务局纳税服务工作为调查和研究过程,基于CCS
随着我国经济的迅速崛起,互联网产业伴随着信息技术的进步蓬勃发展,互联网经济对国民经济的重要性逐步凸显。同时,娱乐领域对互联网的应用也越来越深入,网红相关企业陆续诞生。在这其中,社交电商的规模比整个电商行业的规模同比增速高出20%至30%,显得尤为突出。然而,网红经济虽然取得了高速发展,但是网红市场日趋饱和、市场规范不足以及同质化严重的问题就逐渐显露。由于网红企业与传统企业运作方式存一定的区别,如果