基于循环序列学习与金字塔空洞卷积的目标检测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhyjrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着芯片技术的发展,用于获取光学图像与视频的设备越来越多,比如摄像机,无人机,手机等,如何从大量的图像和视频数据中得到感兴趣的目标,具有十分重要的意义。其中,图像目标检测需要在图像中识别和定位出特定类别的目标,可以作为视频目标检测的基础技术,因此本文主要研究了如何利用深度学习和循环序列学习来对图像和视频进行目标检测与识别,首先提出了一种图像的目标检测方法,然后在此基础上,设计了两种视频目标检测方法。1.提出一种基于金字塔空洞卷积网络的图像目标检测方法。该方法基于单步多框检测器SSD进行改进,针对其产生的浅层特征图表达能力不强的问题,设计多尺度金字塔空洞卷积模块,使其能够学习目标不同尺度的信息,另外,改进了传统的残差块,加入空洞卷积层,对深度特征进一步特征提取,从而产生多个尺度特征图用于检测。该方法在光学图像数据集VOC和遥感图像数据集NWPU VHR-10上进行实验,通过设计的模块,精度逐步提升,并与现有一阶段目标检测算法SSD,YOLO v2,两阶段目标检测算法FPN,RFCN等进行对比,获得了较高的精度,表明了该方法的有效性。2.提出了一种基于跟踪轨迹候选解生成的视频目标检测方法。该方法针对使用单帧图像目标检测器检测每帧图像后出现的漏检和误检问题,分别使用设计的跟踪模块和修正模块进行解决。其中利用跟踪算法生成跟踪轨迹候选解,可以捕捉到由于目标运动模糊或者遮挡而漏检的目标。另外,设计的假阳性分析策略,由于关联帧之间的上下文关系,能够删除误检的目标,提升视频目标检测的精度。该方法在Vis Drone和Image Net VID视频数据集上进行实验,通过添加的模块,提高了目标召回率和精度,并与其他基于后处理的视频目标检测方法Seq-NMS,T-CNN,端对端算法FGFA进行对比,获得了较高的精度,验证了该方法的有效性。3.提出了一种基于循环序列学习与金字塔空洞卷积的视频目标检测方法。该方法摒弃检测速度慢的多阶段的视频目标检测框架,基于循环序列学习建立端对端的检测网络。其中,设计长短时记忆模块,使其能够学习每帧图像特征之间的时序关联,从而增强每一帧图像的特征表达,另外,为了提高多尺度目标的检测精度,使用多尺度金字塔空洞卷积模块,对浅层的特征学习多尺度目标信息。该方法在Image Net VID和Vis Drone视频数据集上进行实验,并与其他视频目标检测算法DFF,FGFA,STMN进行对比,获得了较高的精度,证明了所提出方法的优越性。
其他文献
植物-害虫-天敌之间三级营养互作机制问题是昆虫生态学领域的研究热点之一,不同生态系统中各营养级之间的上行效应与下行效应也是一直争论的主题之一。景观格局变化、景观破碎化影响着害虫和天敌之间的相互作用。柠条(Caragana sp.)是西北沙化区重要的防风固沙植物,也是重要的饲用经济植物。豆荚螟(Etiella zinckenella)、柠条豆象(Kytorrhinus immixtus)和柠条种子小
矿山生产是多系统构成的统一体,各系统之间互相依赖、相互制约。在矿山生产中,立井提升系统是矿井生产的“咽喉”要道,提升系统正常与否不仅影响生产,还直接关系着乘员的生命安全。立井提升多以摩擦提升为主,随着矿山生产向大型化,自动化,智能化方向发展,大型摩擦提升系统应用越来越多,大型摩擦提升系统对安全性及可靠性提出了更高的要求。消除提升系统的事故隐患,杜绝事故发生是保障提升安全,特别是确保大型现代化矿井安
至新农村建设以来,我国乡村建设发展迅速,居民生产生活水平得到了显著提升。就我国目前的乡村景观发展现状而言,随着城市化进程的加快,乡村本土文化正遭受着前所未有的冲击,面临的一大危机便是乡村本土特色的丧失,随之而来的便是“千村一面”、历史文化流失、传统手工艺术失传以及生态系统失衡等问题。乡村景观是地方物质和精神生活形态的体现,在乡村景观设计中必须做到保护历史遗存、传承传统文化和村庄肌理。我国关于乡村景
目的:酸枣仁汤是医圣张仲景的著作《金匮要略》中的经典方剂,用于治疗肝血不足、虚热内扰之失眠。酸枣仁汤流传后世,被历代医家所沿用。历代医家在运用酸枣仁汤治疗疾病的临床诊疗中发现,酸枣仁汤除了能够治疗失眠之外,还可以治疗其他临床各科的疾病。直至今日,酸枣仁汤仍然被运用于现代临床各科的疾病治疗中,并取得了良好的效果。本文的研究目的就是为了揭示酸枣仁汤的方证规律。方法:本文研究共分为两个部分:1.酸枣仁汤
随着天线在各个领域广泛应用,越来越多的天线系统采用了圆极化的工作方式以实现系统对天线的性能要求。圆极化喇叭天线方向性良好并且工作频带很宽,在通信与导航制导等领域有着十分广泛的应用。本文对超宽带的喇叭天线进行研究,使用接入90°功分移相器的方法实现了圆极化,该90°功分移相器可以拆卸更换。论文对超宽带四脊喇叭天线进行了深入研究,对脊波导和同轴馈电的原理做了详细的分析,并对喇叭的匹配腔做了优化分析,最
目的通过观察不同剂量右美托咪定复合罗哌卡因对臂丛神经阻滞起效时间、持续时间及Th1/Th2平衡的影响,为臂丛神经阻滞时右美托咪定复合剂量的选择提供依据。方法选择于佳木斯大学附属第一医院行上肢手术患者60例,均进行超声引导下臂丛神经阻滞,随机分为RD_1组(0.4%罗哌卡因8ml+0.4μg·kg-1的Dex,用0.9%NS稀释至20ml)20例、RD_2组(0.4%罗哌卡因8ml+0.8μg·kg
随着web社交网络的盛行,多媒体信息爆炸式增长,如何从海量图片数据库中快速、准确地查询到与指定图片示例相关的图像,成为目前亟待解决的问题。这一任务不仅有广泛的应用需求,也能为其他计算机视觉任务中数据集的自动构建提供支持。示例图像检索技术的关键在于:使用尽可能小的内存空间,存储具有强描述能力、能够表达图像视觉和语义特征的编码向量。研究图像特征的编码方式能够充分发挥人工智能的优势,提高检索效率,获得更
任熊作为海派绘画的先驱者之一,其人物画的内容、创作观念都极具世俗性特色,在晚清时期有着较大的艺术市场。本文旨在从四个方面探究任熊人物画中的世俗性特点,首先,以其人物画中世俗性的发展过程为脉络,探索其不同时期的世俗性倾向;其次,分析任熊人物画作品,并结合时代环境,与其自身的发展因素,探讨其人物画内容中的世俗性特点;再次,提炼任熊人物画创作观念中的世俗性特点,分析其世俗性的核心要义;最后,以他人物画中
外来入侵植物可能具有区别于本地植物的特殊功能性状。研究入侵种与本地种功能性状的差异,揭示入侵种成功入侵的关键性状和优势策略,是入侵生物学中非常重要的研究方向。不同入侵压力及不同入侵生境下入侵植物对本地植物功能性状和环境因子的影响也可能存在差异。因此,本研究在不同入侵压力下以反枝苋(Amaranthus retroflexus)及其本地共存植物为研究对象,在不同生境下以长芒苋(Amaranthus
该文本选自玛丽·罗伯茨·莱因哈特于1914年出的《后舱》。莱因哈特擅长在小说中刻画神秘气氛,《后舱》讲述了主人公莱斯利从医药学校毕业后一次海上航行的经历,语言清晰简洁,情节引人注目,同时,对不同场景的描绘也令人称赞。本文以彼得·纽马克的交际翻译理论为基础,对小说《后舱》的翻译进行探讨和分析。交际翻译强调译者在翻译时要力求译文产生的效果跟原作尽可能相同。从这个角度看,为了引起读者的兴趣、激发读者的反