基于深度卷积神经网络的单阶段目标检测算法的研究

来源 :河南大学 | 被引量 : 0次 | 上传用户：wsionw47071

【摘要】

：

随着大数据技术的快速发展和国家对人工智能领域的大力支持,基于深度学习的目标检测技术广泛应用于行人检测、人脸检测、汽车无人驾驶、智慧城市以及快递物流等多个领域。而

【作者】

：

杜浩浩

【出处】

：

河南大学

【发表日期】

：

2004年期

【关键词】

：

深度可分离卷积自注意力机制损失函数多光谱行人检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据技术的快速发展和国家对人工智能领域的大力支持,基于深度学习的目标检测技术广泛应用于行人检测、人脸检测、汽车无人驾驶、智慧城市以及快递物流等多个领域。而深度卷积神经网络在目标检测技术中能够自动提取图像中更加丰富的特征信息,很好地解决了传统目标检测算法中网络泛化能力差,手动设计特征难以解决目标多样性等难题,并且在检测速度和准确度上都有了很大的提升。但基于深度卷积神经网络的目标检测技术并不能够同时兼顾检测模型的准确度和检测速度,而基于Darknet网络的YOLOv3算法作为极具代表性的单阶段目标检测模型,很好的平衡了检测准确度和检测速度之间的关系,在实际工程应用中有着很高的参考价值。本文在基于深度卷积神经网络的单阶段目标检测算法的研究方向上,结合现有的单阶段检测算法YOLOv3,通过对具有自注意力机制的轻量级主干网络的设计,边界框的度量标准的设计,收敛更加迅速准确的损失函数的设计,以及在预测阶段对非极大值抑制算法的改进等措施提出了一种新的单阶段的目标检测算法,具体措施如下:(1)为进一步提高YOLOv3的检测速度,在网络模型设计的过程中,我们使用深度可分离卷积代替传统的卷积操作,使得网络在有效提取图像特征的同时,大大的减少了网络参数。同时算法在网络的每个卷积模块中,分别在空间和通道两方面引入了自注意力机制,使得网络在执行卷积操作时能够更加关注图像中目标信息,更加有效地提取复杂的图像特征信息。(2)在模型训练过程中,我们重新设计了预测边界框之间的度量标准,使用GIo U算法更精确的表示两个边界框的重叠程度,并结合GIo U对原有的损失函数进行了重新设计。具体的,为加快损失函数的收敛,本文使用边界框之间的重叠程度以及两个边界框之间的中心点距离作为损失函数替代原有计算中心点的损失函数和边界框宽度和高度的损失函数,并使用YOLOv3原有的物体类别和置信度的损失函数,使得边界框在训练过程中有着更快更准确的回归,也使得检测算法对于图像中的小目标检测更加友好。(3)在模型预测的过程中,结合GIo U算法对原来的非极大值抑制算法进行改进,在筛选候选框时使用高斯模型对周围的边界框进行抑制,而不是删除它们,并计算有关GIo U和边界框中心点距离的值作为筛选候选框的阈值。这使得模型在进行预测时,能够在一定程度上避免删除密集图像中的遮挡目标,筛选出更加准确的候选框。最后在Pytorch框架下,分别使用Pascal VOC和MSCOCO 2017数据集对本文设计的目标检测模型进行训练、验证和测试。实验结果表明,相比原来的YOLOv3检测模型,本文所设计的单阶段目标检测模型在总体检测精度以及对图像中较大物体或者单一物体的检测精度上表现相近,m AP值达到了0.5左右。但是在小目标检测和目标遮挡问题上有着更好的表现,小目标检测的检测准确度m AP达到了18.2%,增加了一个百分点。同时与其它主流的目标检测算法相比,本文所设计的单阶段检测模型在检测速度上有着明显的提升。除此之外,为进一步提高本文设计的单阶段检测算法的泛用性,本文使用KAIST多光谱行人数据集对所设计的模型进行训练和测试,并对红外图像中的行人进行检测。测试结果表明,本文所设计的目标检测算法有着更高的检测准确度,最终的m AP值达到了0.8以上。

其他文献

钴基纳米复合材料的表界面调控及其光/电催化增强效应研究

未来代替能源最有效的技术之一是利用光催化和电催化技术将太阳能和化学能转化为电能,而高效催化剂的设计合成是关键技术之一。研究发现,大多数过渡金属（例如Co、Ni、Fe、Cu）复

学位

钴基催化剂低维纳米材料表界面结构电催化氧化光催化产氢

基于稀疏表示的单幅图像超分辨率研究

近年来,在单幅图像的超分辨率(Super Resolution,SR)重建算法中,基于稀疏表示的图像超分辨率算法由于其重建图像的视觉效果较好,得到了广大学者和研究人员的关注。但是该方法

学位

稀疏表示字典学习自适应块划分图像自学习超分辨率重建

JZD公司销售人员绩效考核的优化研究

合理科学适用的绩效考核有助于评价员工价值,提升员工能力,激发员工工作积极性和主动性,有助于提升企业整体效率,调控内部资源,优化内部运营流程,减少各类费用支出,降低企业

学位

员工价值绩效考核JZD公司绩效考核优化

三相四线制APF中关键问题的研究

全控型开关器件的诞生,使电力电子技术得到了飞速的发展。但随着非线性电力电子装置的大量使用,给电网注入了大量谐波电流。此外无功电流和三相不平衡电流也让电网电能质量面

学位

有源电力滤波器三相四线制中点电位无差拍控制LCL拓扑

HD露天煤矿安全风险预控管理体系构建与应用研究

随着露天煤矿开采装备水平的快速提高,我国露天煤矿产业得到了迅速的发展,露天煤矿在规模、工艺、技术和管理方面不断进步,已经成为产量位居世界第二的采煤强国。但相对露天

学位

露天煤矿安全风险风险评估风险预控

台风激发地脉动源区的定位及分析

陆上地震台站记录的地脉动信号(~0.05-0.5 Hz,一般以~0.12 Hz为界,分为单频和倍频两类)主要源自海浪活动。台风期间,剧烈的海气交互作用激化海浪活动,促使地脉动信号显著增强

学位

台风地脉动台阵聚束3-D地球模型涌浪频散

基于LCA的机床卡盘行业实施生产者责任延伸的影响因素研究

机床卡盘作为保证机械加工精度的核心功能部件,在现代制造业中具有基础性地位。近年来,随着制造业多品种加工对精度的要求日益提高,机床卡盘的淘汰率不断增加,废弃机床卡盘造

学位

机床卡盘全生命周期评价生产者责任延伸Fuzzy-DEMATEL方法

基于交互式ESO反演算法的板球系统控制

板球系统本身具有高阶、不确定性、非线性等动力学特性,是控制理论研究的典型验证对象。本文针对板球系统开展基于交互式ESO的反演算法控制研究,针对其系统结构和动力学特性,

学位

板球系统不确定性交互式ESO反演法线性扩张状态观测输出最优跟踪控制

德语媒体中的中国游客形象

2001年12月,国务院第50次常务会议通过《中国公民出国旅游管理办法》,自此,中国出境旅游人数稳步上升。与此同时,媒体中对于中国游客行为的讨论也逐渐增多。为减少中国游客的

学位

中国游客媒体形象语料库语言学

基于深度学习的蝴蝶图像分割和识别研究

自然界生物的多样性对保持生态平衡,促进人与自然和谐发展具有重要意义。昆虫是地球上种群数量最庞大的一类生物,而蝴蝶作为其中的一员与人类的生产、生活息息相关。自然界中

学位

蝴蝶图像Mask RCNNGrabCut细粒度分类双线性池化

基于深度卷积神经网络的单阶段目标检测算法的研究

其他学术论文