基于深度学习的行人搜索研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tujiangbo110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着监控设备制造技术的成熟,大大小小的公共安全摄像头如雨后春笋般冒出。公共事务大到刑侦破案,小到社区管理都要借助监控找到目标行人。因此对目标行人的定位和检索具有较大的现实意义。行人重识别研究如何跨摄像头找到同一行人。但这个课题的前提是人已经被检测出来,即在事先存在的行人检测图上开展的。因此行人重识别研究有一个现实问题:实际成像的全景图片中不只有行人还有大量的背景,即行人位置的不确定。所以对于实际成像来说,联合行人检测和重识别更加贴合实际。而行人搜索则是将行人检测和重识别联合考虑的课题,具体是指从全景图像中,寻找行人所在的位置并与待查询行人进行匹配。因此本文工作主要围绕着行人搜索展开,具体工作如下:首先,因为摄像头拍摄视角不同,远近不同,得到图片中的行人所占像素大小不同,然而骨干网络往往输出最后一层的特征图进行多任务学习,会导致尺度小的行人特征响应小,难以检出。基于以上问题和相关思考,本文提出了融合浅层、中层和深层特征的特征提取骨干网络,以此为基础在浅层特征上设计空间注意力模块,强化位置信息表达;在深层特征上设计通道注意力模块,强化语义信息的输出。实验表明本文设计的骨干网络能一定程度上提高行人搜索的性能,证明了这种组合的有效性。其次,针对网络空间不变性有限问题,本文设计了一种候选区域精修模块,通过学习仿射变换参数提升网络模型对空间变换的泛化性能。由于行人不是标准矩形,矩形区域采样会不可避免地带来背景噪声。针对背景噪声问题,本文采用一种自适应区域采样模块,该模块对感兴趣区域池化的矩形规则采样进行改进,让每一个采样区域内的小块能够小范围移动,让网络显式地学习并聚焦于行人部分,以此来消除背景噪声带来的影响。实验表明该组合方法能够提升行人搜索性能。最后,从构建细粒度特征表达出发,本文在单步端到端网络框架的后段中设计了一种局部特征和全局特征联合的算法。因为行人特征图从上到下的分块对应人体结构从头到脚的局部部位,所以算法采用对行人特征图进行水平均匀分块的方法来提取局部特征。将多个局部特征和全局特征联合起来作为行人的特征描述,通过引入局部特征这种细粒度信息,丰富行人特征表达。本文进一步提出局部特征筛选模块来消除离群的局部特征点对网络训练产生的扰动。实验表明,联合局部和全局特征的方法能够提升行人搜索的性能。
其他文献
论文涉及一种针对卫星图像的多模态数据处理系统的设计与实现。针对星载红外目标监视图像数据率高与星地数传带宽有限的矛盾,以及星载资源受限下的数据实时处理传输难题,论文研究了多模态数据处理传输方法及其FPGA实现技术,提出基于弱小目标检测的动态感兴趣区域提取、静态感兴趣提取、抽帧全域/静态区域/动态区域数据调度下传技术,完成了基于FPGA的硬件设计与实现,具体内容如下:首先,针对数据传输带宽有限的难题,
学位
本文研究的面向多视图船舶目标检测优化技术主要涉及到水面舰船目标的定位识别、迁移学习和半监督学习等技术,本文的目的是通过实际场景的特点解决不同场景下船舶检测任务的难点,其中包含航拍俯视图场景与光学摄像头前视图场景。本文研究内容如下:1)针对基于无人机成像的俯视图场景数据中存在的复杂背景以及船舶目标特征过拟合问题,本文提出了特征图增强网络。以常规目标检测网络结构为基础,特征图增强网络通过自适应特征图掩
学位
磷矿石中的稀土元素测定方法主要使用电感耦合等离子体质谱法(ICP-MS),样品处理方式主要采用敞口混合酸溶和碱熔。传统的酸溶和碱熔处理矿石样品时间较长,试剂加入量大,操作过程较为繁琐,且易造成环境污染。微波消解直接向样品释放能量,工作效率高,且易挥发元素被保留在消化溶液中,防止挥发造成结果偏差及环境污染。本文采用微波消解对磷矿石进行处理,并在二次消解过程中加入饱和硼酸络合溶矿过程中产生的不溶物氟化
期刊
近年来,由于SRAM型FPGA具有体积小、功耗低、运算速度快等优点,在宇航设备中得到了广泛的应用。然而,太空环境中存在着大量的单粒子或重离子,它们对半导体材料的冲击极易导致FPGA内部结构发生故障,从而导致整个电子系统失效。目前,在地面模拟单粒子翻转(SEU)的主流方法是通过修改FPGA配置位流文件,但这种模拟方法不能定向对某个具体模块或者功能进行故障注入,不仅具有较大随机性,而且效率非常低,不能
学位
红外与可见光图像融合是图像融合领域中的一个热门研究方向。红外与可见光图像融合的目的是使得融合图像中尽可能多的保留红外图像中的以像素强度为特征的热辐射信息和可见光图像中以梯度为特征的纹理信息,使融合图像能够更好的应用于目标识别、跟踪等任务。本文针对红外与可见光图像融合问题进行研究,主要工作有以下几个方面:(1)针对传统图像融合领域在活动水平测量和融合规则设计等方面的复杂性,提出了一种基于图像分解的孪
学位
单相接地故障消失引起的铁磁谐振是导致中性点不接地系统中PT熔断器熔断的最常见原因。文章针对云南某配电系统一次PT熔断器熔断事件的录波数据,结合铁磁谐振机理和类型,详细分析了事故经过及原因;利用快速傅里叶变换(FFT)进行频谱分析,确定了铁磁谐振的类型;最后分析了现场二次消谐装置未能正确动作的原因,并给出治理措施建议。
期刊
金属矿石稀土含量测定的前处理过程中由于氢氟酸的低沸点特性,样品消解温度低,容易引发部分样品稀土含量损失,影响最终的测试结果。利用氟化氢铵相较氢氟酸有更高的沸点,且在加热过程中可分解产生氢氟酸的特性,采用硫酸、氟化氢铵和硝酸消解多金属矿石样品,建立了电感耦合等离子体质谱(ICP-MS)法测定多金属矿中稀土元素的分析方法。通过考察氟化氢铵用量、消解温度和消解时间对分析结果的影响,最终选择称样量为0.0
期刊
车辆目标自主检测是遥感侦察和精确导航领域的关键技术,深度学习成为红外图像时敏目标检测算法研究的主要方向之一,其性能与训练样本的规模和质量密切相关。然而,实际应用中待检测车辆往往为非合作目标,很难获取大量的实际目标红外图像数据,尤其是复杂战场环境下目标多视角图像,网络模型训练面临少样本甚至零样本的难题,且目标成像像素数少。因此,本文提出一套面向少样本目标检测的图像增广方法,设计目标检测网络,并实现模
学位
随着遥感卫星压缩图像下传模式和数据类型越来越复杂,对新型号卫星地面解码系统性能提出了很大的考验。本文研究内容涉及一种高性能卫星图像解码系统软件的设计与实现,其具备兼容多任务模式的扩展性、保证新任务模式下的实时性和应对复杂故障类型的稳定性。对以上三种高性能需求,开展了系统架构的解耦重构、时延分析与优化和系统故障恢复技术的研究。最终在当前某实时卫星图像地面解码系统的基础上,基于新任务模式的任务特点,针
学位
遥感卫星技术的快速发展和相关产业的迭代升级给配套的地面图像处理系统带来了快速部署的要求和挑战。图像实时解码系统是本课题组为某系列遥感卫星研发的支撑系统,属于地面图像处理系统的一部分,负责将传输到地面的压缩码流实时解码还原成图像数据。现有解码系统软件基于不同卫星型号和不同应用阶段定制化开发,通用化程度不高,不利于当前系统的管理维护和后续系统的快速部署。为此本文对解码系统软件进行通用化设计,面向此系列
学位