基于卷积神经网络与运动特性的图像目标检测技术研究

来源 :战略支援部队信息工程大学 | 被引量 : 1次 | 上传用户:lws8228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能逐渐成为热门的技术领域,诸多行业相继提出“人工智能+XX”的概念,极大地推动了人工智能的发展。图像目标检测是人工智能中一个重要的发展方向,研究图像目标检测技术具有十分重要的意义。在军事上,能够提高部队战斗力与智能化水平;在民用上,相关应用全面覆盖衣、食、住、行。本文在总结研究现状、剖析图像目标检测原理的基础上,从静态图像目标检测和序列图像目标检测两个方面展开研究。本文的主要工作包括:1.从静态图像目标检测、序列图像目标检测两个方面对图像目标检测国内外研究现状进行梳理和总结,提炼出当前研究存在的问题。系统地分析了以Faster RCNN、YOLOv3等算法为代表的基于CNN的静态图像目标检测原理与以帧差法为代表的基于运动特性的序列图像目标检测原理,在对CNN的前向逐层运算及输出特点、推断过程的后处理、算法性能评价方法、两阶段法与一阶段法的特点分析和帧差法、运动目标区域增强方法进行详细介绍和分析的基础上,提出本文研究框架。2.针对如何快而准地实现静态图像中目标检测与包含更多差异度小的多种多值属性识别的问题,在基于CNN的静态图像端到端的一阶段法YOLOv3基础上,提出一种端端快速目标检测与属性识别算法。考虑到多种属性间存在依赖关系可被利用,通过规划属性的划分,将属性分成主属性、依赖属性和一般属性三种类型,并提出由主属性引导的依赖属性取值确定方法。即训练过程中,在分类损失函数中对依赖属性不可能出现的取值和主属性分类损失赋予较高的惩罚系数;推断过程中,由主属性预测取值确定依赖属性取值的范围。由于多种属性的多个取值将组合得到大量类别,不利于NMS处理,为此,提出以预测目标框包含真实目标的定位置信度作为NMS排序依据确定目标的预测位置,并基于投票法确定对应目标各种属性的预测取值。此外,提出top-1定位&识别准确率和top-3定位&识别准确率度量算法精度。3.针对如何以较低的漏警率和虚警率对序列图像中运动小目标实施检测的问题,基于目标的运动特性,特别是其在帧间形成的航迹,提出一种航迹关联运动小目标检测算法,将运动小目标检测分解为疑似目标的初步检测和疑似目标中虚假目标的过滤两个过程。由于帧差法存在阈值单一化的问题,为此,提出区域纹理特征与差值概率融合的二值化阈值设置方法,该方法基于各个划分子区域中的倒数差分矩自适应地确定阈值,从而可以在一定程度上降低漏警率。在上述阈值确定方法基础上,基于帧差法和运动目标区域增强方法实现采用中心位置标记的疑似目标初步检测。为了进一步降低虚警率,通过计算疑似目标航迹关联相关参数,并设置双门限实现疑似目标中虚假目标的过滤。4.针对如何进一步确定序列图像中运动小目标的具体类别与修正目标位置的问题,在提出的基于CNN的两阶段运动小目标识别算法基础上,构建双视场下运动小目标检测与识别系统。该系统首先对较小焦距镜头与较大焦距镜头的成像进行配准,以建立双镜头形成的双视场中共有区域成像的像素位置对应关系;然后,基于上述建立的对应关系,在较大焦距镜头成像中生成可能包含运动小目标的候选区域;最后,利用所提识别算法确定上述候选区域中运动小目标的具体类别和修正位置。此外,分析了识别过程中的主要运算耗时,通过对各种主要运算的时间复杂度分析,说明所提提速方法与策略的有效性,并对系统界面设计、硬件组成、实际运行效果、模块组成与编码实现做出详细说明。
其他文献
恶意串通行为无效规范因为条文内涵、构成要件、适用范围上的模糊性,一直以来都遭受了不少的质疑与诟病,主张废除者不在少数。原先《民法通则》与《合同法》的规定因为条文内容确实过于简单,遭受疑诟无可厚非,然而,《民法总则》第154条对恶意串通行为规范作出了一定的补充与完善,但仍然存在不少疑难问题与学术争端。本文通过对恶意串通相关条文的分析,探讨理论界的观点分歧,结合我国的审判实务情况,对《民法总则》第15
群感效应(Quorum sensing,QS)是细菌根据密度大小进行的细胞内或细胞间的信息交流(Cell-cell communication),协调群体行为和调控基因表达的一种重要的行为方式。N-酰基高丝氨酸内酯(N-acyl-homoserine lactones,AHL)作为群感效应系统的信号分子,在其中起到重要作用。当环境中的AHLs的浓度达到一定阈值时,QS系统的相关基因的启动子才会被激
近年来,通过发展公共交通来解决城市交通拥堵问题己经成为共识,公交系统发展迅猛,居民公共交通出行比例有了稳步提高,但是仍存在上升空间。公交站点及线路布局不合理,公交线路迂回大、换乘衔接不畅,居民出行距离长、换乘多等原因严重影响乘客的积极性。由于公交线路的生成存在诸多困难,公交网络设计问题的最优解很难求出。当网络规模越来越大时,求解难度变大,且无法保证求解效率。因此,需要有一些专门适用于公交线路设计的
重大自然灾害和突发公共卫生事件频发,如何科学高效地进行应急调配决策是应急救援中的一大关键问题。其中人的行为因素是目前的研究热点。然而,行为是因人而异的,即具有异构性。本文针对行为的异构性,聚焦于决策者的学习行为,探讨其异构性对应急调配决策的影响。采用包含初始决策时间和学习率的学习效应函数来对学习行为进行量化。其中,初始决策时间主要是指应急响应决策的时间,即决策是否对灾区进行响应的时间。因此,本文先
充填开采是用充填材料对工作面后方的采空区进行充填的采矿方法,能够有效的控制地表下沉,提高煤炭采出率。本着节能高效的发展思路,采用掺入煤矸石和粉煤灰制备充填材料不仅能够节省充填成本,还能达到废弃物再利用的目的。由于采空区上覆岩层的力学平衡被打破,岩层在应力的作用下产生裂隙,导致地下水流入,所以采空区往往不同程度的含有地下水,充填材料由于长时间充水处于饱和状态,其力学性能和耐久性与正常状态下相比已有了
随着互联网技术的日益发展以及多媒体技术的广泛应用,人们在日常生活中越来越多的使用图像来存储信息。面对海量的图像数据,如何在其中精准且快速的获取图像信息是当前亟需解决的问题。目前,基于内容的图像检索技术虽然能针对性的解决这一需求,但检索效果不理想,再加上图像底层特征与高层理解之间还存在信息不对称的问题。因此设计兼具多特征融合与SVM分类的面料图像检索算法则具有实际的应用价值和现实意义。文中对图像基本
在西方修辞学中,提喻作为与隐喻、转喻、反语相提并论的转义主格有着悠久的历史和显赫的地位。但现今提喻却备受冷落,或不被提及,或仅作为转喻的一个分支。“人格诉求”是亚里士多德提出的三大说服方式之一,为西方修辞学中的核心概念;然而,与“逻辑诉求”“情感诉求”相比,鲜有从辞格的功能视角对其进行的专项探索。本研究将提喻与“人格诉求”相联系,旨在通过分析《孟子》中突出的“君子”提喻来探究该提喻是否以及怎样实现
直觉对现代漆画艺术自身在纯艺术发展起着重要的作用和影响,直觉观照下的现代漆画创作产生出了独特的艺术风貌和新颖的创作方式。直觉观照使得现代漆的表现激发出别样的活力和个性,现代漆画发展前行无时不刻需要创造性思维为意识的动力,以直觉为导向的创作方式为现代漆画创作思维开启一扇崭新之门,孕育出更多创新生机和创作的可能性。本文主要研究题目是直觉观照下的现代漆画创作。在《现代汉语词典》对观照一词解释是,指观察和
越来越多的设计师将汉服元素带上国际舞台,汉服站在世界聚光灯下,代表了华夏优秀民族服饰文化中的汉服文化。汉服不仅仅是服装传统文化的重要组成部分,更是中国服饰文化和封建服饰制度的缩影。我们从艺术中寻找灵感来源,用不同设计手法,丰富创新汉服在现代的发展。本文通过对艺术设计手法“夹层艺术”的审美价值和文化涵养进行研究分析进而对夹层艺术的人文性进行探讨。在研究中首先是对夹层艺术和现代汉服的文化背景、历史发展
新能源材料与器件因其在清洁能源方面具有巨大的潜在应用前景已成为当前材料研究领域最为活跃的对象,包括超级电容器、太阳能电池、电催化水分解等多种领域。在太阳能电池的大家族中,二氧化钛纳米晶染料敏化太阳能电池(TiO_2-dye-sensitized solar cells,DSSCs)由于它的光电转换效率高、使用的材料价格低廉、组装步骤简单等有利条件,是当今非常有应用前景的新能源器件之一。DSSC的对