基于完全卷积的行人目标检测方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:thirdeyes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,行人检测是目标检测热门研究领域之一,主要是利用计算机视觉技术检测图像或者视频序列中是否有行人存在,并且标出每个行人的确定位置。行人检测在智能安全监控、自动驾驶、人机交互等方面有着重要的研究价值和广泛的应用前景。现有行人检测方法大多采用特征金字塔进行多级预测,虽然能检测多尺度的目标,但易产生离物体中心较远的预测框,导致检测精度不高。在行人密集、遮挡严重的情况下,相关网络模型无法获取足够的目标特征,从而导致错检、少检的情况。针对上述问题,本文主要开展如下两个方面的研究:(1)针对特征金字塔易产生大量低质量的预测框,本文提出了一种基于动态选择最佳特征的行人检测方法。首先,通过在检测头网络中加入中心性分支,以降低低质量预测框的权重,从而减少低质量预测框的数目。其次,耦合动态选择最佳特征(Dynamic Selection of Optional Feature,DSOF)的模块,通过计算不同特征层的总损失函数,对其取得最小值的层级进行特征训练,实现最佳特征的动态选择。再者,通过样本区域的划分以优化正负样本的标记方式,提高检测器对前后背景的区分准确度。最后,实验结果表明,该方法实现了对低质量预测框的抑制以及最佳特征的选择,并且提高了对图像前后背景的区分准确度,有效提升了模型的检测性能。(2)针对行人检测遮挡场景中特征提取不足的问题,在基于动态选择最佳特征的行人检测方法的基础上,本文提出了一种基于完全卷积的行人检测特征增强方法。首先联合优化回归特征(Optimized Regression Feature,ORF)模块,通过优化网络结构中的位置回归分支特征,获取回归特征更多的位置信息。同时,引入增强边界特征(Enhanced Boundary Feature,EBF)方法,直接利用从每个边界汇集的边界特征增强原始点特征,使得特征图对目标边界的极值点有很高的响应,受背景噪声影响较小。最后,实验结果验证了该方法可以有效增强行人目标的特征提取,提高了遮挡场景下的行人检测能力。
其他文献
在科学研究与工程应用领域,多目标优化问题普遍存在。这些问题由多个互相冲突的目标构成,难以在有限时间内采用常规方法求解,目前普遍采用进化算法来快速地搜索出一组近似最优解。进化算子是进化算法中的搜索引擎,研究表明,单一进化算子难以处理各种类型的优化问题,因此结合多种进化算子来提高算法的泛化性逐渐成为这一领域的主流研究方向。本文为提高多目标进化算法在求解不同特征优化问题时的能力,从优化现有自适应算子进化
学位
近年来,人工智能技术飞速发展。其中,人机会话系统是当前研究的热点。传统的会话生成技术主要以序列到序列框架为基础,该框架从海量数据集中学习会话上下文的语义信息并生成相关的回复,但基于该框架生成的回复有生成通用响应且包含较少信息等问题。这个问题在一定程度上影响了用户使用体验,降低了人机会话的持续性。利用外部知识可以加深语义理解,丰富响应表达,提供除会话上下文之外的语义信息,使得模型生成更具多样的回复。
学位
随着信息技术行业的不断发展,以车联网为代表的物联网技术规模不断扩大。车联网场景由于符合未来交通的发展趋势也越来越被人们期待。基于边缘计算的车联网通过端边协同实现资源调度,减少对汽车自身所需的算力要求,降低执行任务的时延。目前车联网场景下面向不同任务的端边协同的资源调度处理主要包括传统的批处理任务与复杂的深度学习应用。混合宏基站(Macro Base Stations,MABS)与路边单元(Road
学位
伴随期权进入市场带来的多变性,投资者们为获得无风险收益而迫切关注如何选择投资组合的比例,即金融衍生物(期货期权、证券等)的定价问题。因此本文将研究一个非套利流动市场下含固定波动率的期权定价模型,此模型是建立在“无风险套利原理”和理想化金融市场两个前提条件下。本文首先通过一个变量转换将原始的不支付分红的Black-Scholes模型转换为非线性的抛物型方程;再根据数值差分逼近的原理,对该非线性方程中
学位
非侵入式负荷分解作为电力需求侧管理中的重要组成部分,可以通过智能电表获取总能耗,分析获得其下单个用电设备的能耗数据,从而为需求侧反馈提供技术支撑。该方法旨在监测建筑内各个用电设备的功耗情况,使用户在知晓能源消耗水平的情况下,主动节约能源,提高能源利用率。同时,电力公司通过了解用户负荷构成和消费习惯,制定不同的动态定价策略,引导用户合理消费,有效增强电网运行效率。近年来,基于深度学习模型的负荷分解方
学位
随着时代的高速发展,人与人之间沟通交流的方式也由原始的口口相传、书信通讯变成了利用互联网技术进行的多媒体数据的传播。而在多媒体数据中,数字图像因其简洁直观、信息传达效率高的特点,被人们作为通信载体广泛应用于信息交流中。然而互联网的普及是一把“双刃剑”,随着应用的不断增多和互联网模式对现实场景的不断下沉,图像信息安全问题日益凸显,与之相关的信息安全课题也不断受到研究人员的关注。不同于图像加密技术破坏
学位
目的 :比较机械通气下采用CT与电阻抗断层成像(electrical impedance imaging,EIT)滴定最佳呼气末正压(positive end-expiratory pressure,PEEP)的差异,以证实采用EIT滴定PEEP的可行性。方法:先对7只小猪建立急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)模型,然后在不同PE
期刊
统计过程控制和设备维修决策是保证生产系统稳定和提升产品质量的两大方法。前者通过监控产品的核心质量指标,防止产品偏离所期望的质量,以保证生产过程的稳定性;后者根据设备的运行情况以及故障的历史数据,制定最佳的维修方案,防止设备故障导致生产停滞,以保证生产过程的可靠性。对于多质量特性产品的生产过程,动态控制图能够及时监测到微小的质量偏移,及时发现过程异常。另外,将动态控制图与视情维修策略相结合,构建动态
学位
机器学习近年来应用到气象、医学、环境和材料等领域。在环境材料领域中,具有高比表面积和多孔结构的吸附剂可以去除水体或土壤中的有机污染物以及重金属离子,吸引了众多学者的关注。然而,获得吸附容量和规律的批量实验复杂且耗时,并且目前的研究注重于吸附剂的物化性质,忽略了吸附质和环境因素的影响。机器学习不仅可以对自变量和因变量之间复杂的非线性关系进行建模和预测,还可以从实验数据中探究其隐藏的自然规律。因此通过
学位
随着互联网技术的快速发展,在网络中进行资料生产和信息交流越来越便捷,但同时抄袭剽窃等不良现象也屡屡发生并有愈演愈烈之势,特别是在学术生产活动中此类现象更是被频繁曝光。遏制抄袭剽窃活动的发生与检测识别这些抄袭剽窃活动成为学者研究的热点之一。文本抄袭检测是一门针对文章内是否含有抄袭内容的研究课题,主要分为外部与内部抄袭检测两个框架。虽然目前的方法在复制粘贴和同义替换类型的抄袭形式上具有优异的性能,但仍
学位