基于卷积神经网络的稠密目标检测算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:lvyuxuan36520091
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学技术的发展,图片数据的数量正急剧上升,与此同时,视觉是人类感官信息的主要来源,计算机视觉通过模拟人类视觉系统进行计算、感知、认知,逐渐成为重要的研究方向。目标检测是计算机视觉领域的一个基础的视觉识别问题,在过去的几十年里得到了广泛的研究。其目的是在给定的图像中寻找具有精确定位的目标对象,并为每个对象实例分配相应的类别标签。近年来,卷积神经网络的出现极大的提高了目标检测算法的性能,但随着应用场景的不断丰富,实际应用中对目标检测算法的精确性提出了更高的要求。目标多尺度、目标稠密等因素严重影响了目标检测的效果,在此背景下,本文主要研究了两种算法以应对稠密目标检测,内容包括:提出了基于类加权YOLO的目标检测算法。由于水下目标检测面临着图像模糊、尺度多样化、目标稠密等问题,给水下目标检测应用带来很多挑战,本文提出了一种基于类加权YOLO网络的水下目标检测方法,主要思想是在深度网络YOLO的基础上,构造了类加权损失函数来平衡样本难易程度,获得更好的效果,同时引入了目标框自适应维度聚类方法,进一步提升了检测性能,实验结果表明,本文算法与传统YOLO网络相比,在每幅图片包含近20个目标的稠密目标检测任务中,取得了不错的提升。提出了基于注意力机制的多方向遥感图像目标检测算法。遥感技术的迅速发展极大地提高了遥感图像的数量和质量,在此背景下,近年来研究人员进行了大量的有关光学遥感图像目标检测算法的研究工作。由于在检测遥感图像中较为密集的物体时存在俯视角带来的方向随机、高度复杂的背景和物体形态的多样性等问题,基于遥感图像的目标检测是计算机视觉领域一项积极且富有挑战性的任务。本文基于Faster R-CNN,引入注意力模块,以解决密集小目标问题。并采用了图像金字塔的方法,以降低物体的多尺度问题带来的影响。实验表明,本文方法有效提高了多方向遥感图像目标检测算法的性能。
其他文献
在生产和生活中总是存在各种各样的最优化问题,学者们关于其解决方法展开了一系列研究,其中群智能优化算法是解决最优化问题的一个重要思路。人工鱼群算法(Artificial fish s
差动变压器式位移传感器(Liner Variable Differential Transformer简称为LVDT)凭借其优良的工作性能以及良好的环境适应性广泛应用于高精度控制和检测领域。LVDT在三轴试验
D2D传输是允许终端设备不经基站而直接进行数据传输的短距离通信技术,具有减轻基站负荷、减小设备能耗、降低通信时延等优点,近年来成为移动通信领域的研究热点之一。为了进
研究背景:妊娠糖尿病(Gestational Diabetes Mellitus,GDM)是指怀孕期间发生或初次发现的不同水平的糖耐量受损,其患病率高达6.9%-24.5%。多项的研究表明GDM能导致多种近期及远期的母儿并发症,虽然是于妊娠中期(24-28周)进行的葡萄糖耐量试验而诊断,而其时高血糖对母儿不良影响已经产生。同时,由于二胎政策的实施和生活方式的改变导致高龄孕妇和肥胖孕妇增加,使得GD
随着社会的发展,越来越多的摄像头被安装到商场、地铁、校园、港口和飞机场等公共场所,从而形成了一个大型的视频监控网络。行人重识别就是判断在不重叠摄像头下的行人是否是同一行人的技术。由于不同摄像头所具有的参数、安装角度和周围环境不同,使得在不同摄像头下的行人很容易受到视角、光照和姿态等因素的影响,从而出现同一行人不相似而不同行人更相似的问题。为了解决上述行人重识别中可能出现的问题,本文从特征提取和度量
忆阻器作为新兴的基础信息器件,在非易失性高密度存储、类脑神经形态计算、可重构逻辑运算等领域具有广泛的应用前景,受到学术界和工业界广泛关注。通过调控忆阻器中金属导电通道的稳定性,可以实现非易失性记忆开关和易失性阈值开关行为,前者可以作为嵌入式存储器、非易失逻辑功能的物理基础,而后者则可应用于构建选通管、人工神经元、随机数产生器等。本文系统研究了Cu导电通道型忆阻器的非易失性记忆开关和易失性阈值开关特
本文以2,3-二甲氧基-1,4-苯二醛或2,3-二羟基-1,4-萘二醛为基础原料,以苯基或萘基对其末端基进行修饰,合成了四个Salamo型荧光化学传感器,并通过紫外-可见吸收光谱、荧光光谱
锂离子电池具有比能量值高、循环寿命长和无记忆效应等优点,被广泛应用于电动汽车、航空航天和电力储能等领域。随着锂离子电池的反复充放电,电池容量会逐步下降,循环寿命衰
随着计算机视觉的快速发展,人们对图像的视觉要求越来越高,高质量、信息丰富的全景图也成为人们的日常需求。图像拼接是一种将同一场景下的数幅有序且包含重复区域的图像拼接
随着人类现代生活和生产活动的日益丰富,诸如演唱会、集市、大型招聘会等社会活动变得越来越多。人群聚集活动多发生在城市广场、学校、大型超市等公共场所,随之导致了群体性异常事件的频发,严重威胁到了社会公共安全和稳定,所以基于视频监控下的人群研究有着重要的意义。行人统计研究作为人群研究中重要的课题之一,越来越受到广大研究者的青睐。然而,监控场景中不可避免的会受到诸如物体阴影、光照变化和遮挡等因素的影响,使