多层次深度特征融合的目标检测方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户：cxx163252

【摘要】

：

随着人工智能越来越多的渗透到我们生活工作的方方面面,人工智能技术中非常重要的分支——计算机视觉受到越来越多研究者的关注。而目标检测技术更是众多计算机视觉任务的必

【作者】

：

涂晓波

【出处】

：

江苏大学

【发表日期】

：

2020年01期

【关键词】

：

深度学习目标检测加权特征融合视频目标检测交错模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人工智能越来越多的渗透到我们生活工作的方方面面,人工智能技术中非常重要的分支——计算机视觉受到越来越多研究者的关注。而目标检测技术更是众多计算机视觉任务的必备前提,如事件检测、自动驾驶、智能医疗等。近年来目标检测领域发展迅猛,各种研究成果层出不穷,但是当前的目标检测技术依然有很大的提升空间。本文在大量查阅文献,广泛研究现有研究成果的情况下,对目标检测目前的国内外研究现状、存在的主要问题进行了阐述。之后对目前目标检测的主流方法进行了系统介绍,包括基于深度学习的两段式和一段式目标检测方法。并且对视频目标检测相对于图像目标检测存在的主要难点进行了说明。提出了加权特征金字塔网络用以解决小目标检测精度较低的问题。针对一段式目标检测方法中前景背景样本极度不平衡的问题提出了背景抑制损失函数。在加权特征金字塔网络的基础上提出了针对视频目标检测的交错模型。并开发了集数据处理、模型训练以及目标检测为一体的原型系统。本文的主要研究内容如下:1)针对小目标检测效果不佳的问题,提出了基于多层次深度特征融合的图像目标检测方法。利用卷积神经网络浅层特征具有较高分辨率,深层特征具有较为具体的语义信息的特性。根据不同类型的信息对于最终目标检测效果的重要程度,设计了一个对浅层特征和深层特征进行加权融合的网络结构。使得最终用于检测的特征既能充分利用深层特征提供的高度抽象的语义信息,又能借助浅层特征的高分辨率信息来弥补卷积网络多次卷积后信息不可逆的缺陷。背景抑制函数通过在计算网络损失的时候增大前景分类错误的损失,有效缓解了目标检测过程中前景背景样本极度不平衡的问题。2)针对视频目标检测速度较低的问题,提出了基于交错WFPN的视频目标检测方法。利用视频的时空局部性,使用高精度特征提取网络和高速特征提取网络交叉对视频帧进行特征提取,并通过Group ConvLSTM将不同的特征提取网络进行连接,使得高速特征提取网络能够充分利用前序的高精度特征提取网络提取到高精度特征。通过这样的方式既能够充分利用视频的时空局部性减少冗余计算,又能够合理利用视频的时序信息。实现了速度和精度的良好平衡。3)设计开发了一个集数据预处理、模型训练以及目标检测于一体的目标检测原型系统。系统使用Python作为主要开发语言,PyQT作为用户界面开发框架,PyTorch作为深度学习算法框架。该系统拥有友好的用户界面,灵活的参数设置,直观的检测结果展示等特性。

其他文献

基于LCA的机床卡盘行业实施生产者责任延伸的影响因素研究

机床卡盘作为保证机械加工精度的核心功能部件,在现代制造业中具有基础性地位。近年来,随着制造业多品种加工对精度的要求日益提高,机床卡盘的淘汰率不断增加,废弃机床卡盘造

学位

机床卡盘全生命周期评价生产者责任延伸Fuzzy-DEMATEL方法

基于交互式ESO反演算法的板球系统控制

板球系统本身具有高阶、不确定性、非线性等动力学特性,是控制理论研究的典型验证对象。本文针对板球系统开展基于交互式ESO的反演算法控制研究,针对其系统结构和动力学特性,

学位

板球系统不确定性交互式ESO反演法线性扩张状态观测输出最优跟踪控制

德语媒体中的中国游客形象

2001年12月,国务院第50次常务会议通过《中国公民出国旅游管理办法》,自此,中国出境旅游人数稳步上升。与此同时,媒体中对于中国游客行为的讨论也逐渐增多。为减少中国游客的

学位

中国游客媒体形象语料库语言学

基于深度学习的蝴蝶图像分割和识别研究

自然界生物的多样性对保持生态平衡,促进人与自然和谐发展具有重要意义。昆虫是地球上种群数量最庞大的一类生物,而蝴蝶作为其中的一员与人类的生产、生活息息相关。自然界中

学位

蝴蝶图像Mask RCNNGrabCut细粒度分类双线性池化

基于深度卷积神经网络的单阶段目标检测算法的研究

随着大数据技术的快速发展和国家对人工智能领域的大力支持,基于深度学习的目标检测技术广泛应用于行人检测、人脸检测、汽车无人驾驶、智慧城市以及快递物流等多个领域。而

学位

深度可分离卷积自注意力机制损失函数多光谱行人检测

面向3D视频的帧间错误隐藏技术研究

三维(Three Dimension,3D)视频技术既可以提供给观众“身临其境”的沉浸感,也能为用户呈现不同角度的视频画面,增强了用户的三维沉浸感和场景逼真度,是多媒体技术的重要发展

学位

3D视频错误隐藏感知特性LBP算子编码特性灰度共生矩阵

岩石物理分析在LD地区薄互层储层预测中的应用研究

在地震勘探目标由过去的构造油气藏转向现在的构造-岩性及岩性油气藏的同时,地震解释也开始从定性分析转向更多地关注定量解释,而基于岩石物理分析的叠前地震反演有着明确的目标并且能够提供更准确的结果,有助于定量的解释地震数据,其中岩石物理分析是沟通油藏与地震的纽带,也是这一流程中的关键技术之一。论文所选工区目的层位于岩性地层,属于构造岩性复合油藏。论文中结合工区的地质情况、地震情况、测井资料和储层特点,针

学位

岩石物理分析砂泥岩薄互层横波速度敏感性分析地震响应特征

铁西华晨宝马发动机厂地下水源热泵系统换热效率优化

地下水源热泵作为新兴的节能技术,已成为当今国内外的研究热点,但在开发利用过程中还存在换热效率较低、回灌井堵塞、热贯通等问题,如何提高换热效率是水源热泵工程关注的重

学位

地下水源热泵输水管道保温材料回灌井堵塞保温层厚度合理布井方案选择

迭代重心坐标

随着计算机技术的快速发展,计算机图形学(Computer Graphics,简称CG)和计算机辅助几何设计(Computer Aided Geometry Design,简称CAGD)在工业领域扮演着越来越重要的角色。重

学位

广义重心坐标迭代非负性光滑性

基于近红外的静脉显像仪系统的研究与设计

基于近红外的静脉显像技术已成为近些年来研究的热点课题,其应用的领域包括安防和医疗,本论文的研究方向是医疗领域中静脉穿刺的辅助工具,即静脉显像仪的研究与设计。对于静

学位

静脉显像仪小型化算法验证算法移植

多层次深度特征融合的目标检测方法研究

与本文相关的学术论文