基于注意力机制的行人重识别研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:zoook
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别又称行人再识别,旨在通过匹配行人图像,联合部署在不同位置的非重叠监控摄像头来寻找特定行人,该技术对于智能视频监控的研究发展至关重要。利用注意力机制来优化行人重识别网络提供了一种有效且可并行化的特征强化方法。注意力机制可以在引入少量参数的情况下,实现对于特征中的关键信息进行加权强化,减少无关信息带来的干扰,进而提高行人特征的判别性。本课题针对注意力机制在行人重识别中的应用展开了研究,论文主要研究内容及成果如下。(1)本文提出了一个跨层级强化注意力网络(Cross-level Reinforced Attention CNN,CLRA-CNN),用以解决现有大多数注意力方法仅针对当前层级特征建模注意力关系,同时无意义信息仍占据一定权重而给模型训练带来干扰的问题。首先,设计了一个跨层级特征融合模块(Cross-level Feature Fusion,CLFF)自适应地融合不同层级特征来指导后续注意力模块的生成。其次,本文将软注意力与强注意力方法相结合设计了一个强化注意力模块(Reinforced Attention,RA),分别在空间和通道两个方面对于特征进行权重调整。最终,将CLFF模块与RA模块相结合,得到了跨层级强化注意力模块(Crosslevel Reinforced Attention,CLRA)集成到基础网络中以优化行人重识别任务。(2)本文提出了一个多尺度压缩强化注意力网络(Multi-scale Compressed Reinforced Attention CNN,MSCRA-CNN),用以解决大多数注意力方法仅针对固定尺度特征建模注意力关系的问题。首先本文设计了一个多尺度特征融合模块(Multi-scale Feature Fusion,MSFF),通过联合多尺度特征,使得模型能够根据输入自适应地调节感受野尺寸。其次,为了提高RA模块的实时性,提出了压缩强化注意力(Compressed Reinforced Attention,CRA),分别从空间和通道两个方面实现对于特征的压缩,并利用压缩后的特征来建模空间位置或通道间的相互依赖关系。最后将MSFF模块和CRA模块进行组合得到整体的多尺度压缩强化注意力(Multi-scale Compressed Reinforced Attention,MSCRA),并将其嵌入基础网络中实现对于行人特征的强化。(3)本文提出了一个多尺度注意力多分支网络(Multi-scale Attention Multi-branch CNN,MSAMB-CNN),针对大多数工作更多关注行人图像中最显著信息,而对于次显著细节信息关注不足的问题,实现图像显著信息及次显著信息的协调统筹。首先,本文将简化的多尺度特征融合方法与双重注意力机制相结合,设计了一个多尺度注意力模块(Multi-scale Attention module,MSA)实现对于全局特征的加权强化。其次,将MSA模块与批量特征丢弃方法相结合得到加权特征丢弃方法,实现对于局部特征的加权强化。进一步地,提出一个模糊图像切分策略与加权特征丢弃方法相结合获取更加细节丰富的局部特征。最后建立一个多分支网络,实现对于全局特征和多元局部特征的协调统一,得到更具判别性的特征用于最终识别。综上所述,本文提出了三种基于注意力机制的行人重识别网络:CLRA-CNN、MSCRA-CNN以及MSAMB-CNN,且在多个公开数据集上通过大量实验论证了本文所提算法的优良性能。
其他文献
国家治理现代化的正确方向在于坚持中国特色社会主义制度、坚定不移走中国特色社会主义道路。道路自信、理论自信、制度自信、文化自信分别从不同角度、不同层面为国家治理现
意象造型在装饰壁画的艺术表现中常常起着核心的作用,意象造型的优劣往往影响装饰壁画形式美感和精神情感的传达,也影响建筑环境的心理空间与广大公众的视觉品位。作为高校壁
得益于互联网技术的发展和国家政府的响应,“互联网+”成为一种新的商业模式,“互联网+外卖”就是用互联网思维来改造餐饮外卖行业。几年时间里,从交易规模、使用人数和使用
目的甲状旁腺激素(1-34)对空心钉治疗老年股骨颈骨折合并骨质疏松症疗效的观察及分析,为老年股骨颈骨折合并骨质疏松寻找到安全可靠,更具有良好疗效的治疗方案。方法 2010年1月
本文根据自主研发的无人机飞行控制系统设计了一款基于Android的无人机监控系统。该系统使用Android Studio软件平台开发,在XML文件中完成界面设计,使用Java语言实现功能需求。相较于传统的基于PC端无人机监控系统,本设计具有携带方便、实用性强、性价比高、功能全面等优势。本文主要工作内容如下:1)根据系统需求分析出整体结构,概括了硬件平台的搭建和所需硬件模块的功能需求;分析了界面组成
对圆柱阵建立数学模型,运用射线声学原理对其指向性进行理论分析,推导得到活塞阵元圆柱阵的指向性函数;通过MATLAB绘制指向性函数曲线,研究得出圆柱阵的水平阵元数、半径比波
采空区的稳定性问题除了岩体强度、节理、裂隙、层面等地质缺陷自身的因素外,地震、爆破、地下水等外界的因素也不容忽视。本文利用离散元软件UDEC模拟了地震波对天德石膏矿采
在对山西四个国有煤炭集团矿区生态重建与植被恢复情况实地考察的基础上,针对其矸石山类型划分、生态破坏过程及治理与植被恢复的现状,客观分析了矿区复垦存在的问题、原因及
未成年人是祖国的明天和民族的希望,也是博物馆观众群体的重要组成部分,而博物馆是传承人类文明的重要载体,作为区别于家庭教育和学校教育的特殊教育机构,在未成年人教育过程
2019年6月12日,江苏省小学珠心算教育实验研究基地学校教学研讨活动在海安市明道小学教育集团丹凤校区举行。中国珠算心算协会副会长、江苏省珠算协会会长汪以力,江苏省财政