基于双流多级注意力感知优化的视频行人重识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：hangxujie

【摘要】

：

随着视觉大数据的和人工智能的发展,视频数据的分析是未来计算机视觉领域的关键,其中监控视频的行人识别、检索和分析是一项越来越重要的任务。多个摄像头之间的行人匹配任务

【作者】

：

林文根

【出处】

：

华南理工大学

【发表日期】

：

2004年期

【关键词】

：

视频行人重识别深度学习卷积神经网络循环神经网络上下文感知多模态感知注意力感知

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着视觉大数据的和人工智能的发展,视频数据的分析是未来计算机视觉领域的关键,其中监控视频的行人识别、检索和分析是一项越来越重要的任务。多个摄像头之间的行人匹配任务称为行人重识别,这个任务是在定位出行人位置之后对行人进行区分。现有的研究方法有基于图像的和基于视频的行人重识别,其中视频行人重识别任务的更加困难,也是未来视频时代的攻坚任务。随着深度学习的发展,基于卷积神经网络和循环神经网络的行人重识别方法取得了诸多突破,许多将基于图像的行人重识别算法在时序上应用到视频行人重识别研究上,有着可观的效果,更多的方法基于视频本身连续序列的特性构建相关网络,或者通过从不同维度对视频信息的描述进行建模,实现多模态信息的监督,也取得了显著成效。但视频行人重识别还存在着诸多不足,一方面,由于视频本身连续序列的特征相关性没有得到体现,视频特征的重要性没有有效区分,影响了视频特征的表征效果。另一方面,在通过不同维度对视频进行描述时,缺乏从跨维度、跨模态的全局视野去捕捉更具整体判别效果的关键特征。因此本文针对以上两个问题,提出了视频特征的多级感知优化方案,从视频帧和视频段两个级别对特征进行优化,提高特征判别力。本文主要贡献有:1)本文在“RGB+光流”的双流模型的基础上,从帧级别设计了上下文感知和多模态感知的特征优化结构,构造了双流循环交互感知网络TS-RCAN。该网络采用卷积神经网络提取基础特征,通过循环神经网络进行特征串联,通过两种门结构的设计分别进行上下文感知和多模态感知,这两种门结构都是采用通道注意力的设计方式实现特征的重要性区分,从而实现特征优化,提高每一帧的特征表达能力。2)本文将Non-local的自注意力机制拓展到行人重识别的双流网络上,学习每一个模态的整个视频段时空特征之间的关联关系和重要性区分,形成双流段级注意力感知优化网络TS-SAPN。TS-SAPN的注意力感知方法与其他自注意力机制不同之处在于其通过利用上一阶段的帧级优化特征生成关联权重掩码,引入了多模态的感知信息,提升了注意力感知得到的特征辨别效果。本文将帧级别和段级别的优化网络相结合得到双流多级特征感知优化网络TS-MLPN,从两个级别、三种感知对视频双流特征进行优化,将视频帧级别和视频段级别的优化特征沿通道融合得到视频的最终特征表征,有效提升了双流特征的整体表达能力。本文在两个公开数据集上对提出的TS-RCAN和TS-MLPN进行了测试,并将测试结果与近几年的视频行人重识别的前沿算法进行对比,显示这两种网络都有着更优的行人重识别检测效果,验证了本文的感知优化策略。

其他文献

双论域变精度粗糙集扩展模型研究

随着科学技术与网络技术的迅猛发展,人类已进入大数据和人工智能时代。一方面,数据规模、类型、价值与时效的急剧变化,另一方面,模型场景、环境、需求与计算的日益复杂,人类

学位

U×W型双论域U×W型变精度粗糙集U×W型变精度模糊粗糙集不确定性度量

功能化纳米粒子电化学传感器的构建及应用

基于功能化纳米粒子修饰电极的电化学传感器由于制备方法简单、操作性强、选择性好、灵敏度高、响应时间短、检测成本低等优势,已被广泛应用于工业生产、临床医学、药物分析

学位

功能化纳米粒子电化学传感器木犀草素黄芩素L-组氨酸

多特征点融合的手背静脉身份识别算法研究

如何安全高效地识别个人的身份,是信息化时代必须要解决的一个重要问题。传统的身份识别方法,如身份证、用户名等,存在着容易遗失和泄露等无法克服的缺点,越来越难以满足社会

学位

手背静脉身份识别ROI提取最大曲率算法特征点Hausdorff距离欧氏距离

基于低秩分解的织物疵点检测算法设计

推进纺织业智能信息化建设不但是国家战略也是行业需求,其中织物疵点的智能自动检测是重中之重,占据重要地位。因其作为纺织业质量控制的重要环节,直接影响产品质量,关系到企

学位

疵点检测周期性纹理织物不规则印花织物低秩分解双稀疏低秩分解

基于卷积神经网络的单目深度估计

深度估计在很久之前就在计算机视觉中得到很大的关注,到目前为止仍旧是一个有待继续研究的课题,因为深度估计不同于其他的计算机视觉算法,比如目标检测,人脸识别等,只需处理

学位

深度估计空洞卷积深度学习计算机视觉

基于卷积神经网络和多尺度特征融合的骨龄评估方法研究

骨龄评估通过骨骼发育形态推断儿童生长的实际情况,具有很多临床应用,例如诊断内分泌疾病和预测青少年最终的成年身高等。骨龄评估方法根据发展的历程可以分为:基于人工估计

学位

骨龄评估非下采样轮廓波变换卷积神经网络特征提取数据融合

区域土壤侵蚀遥感快速抽样调查方法研究

作为全球范围内影响较为严重的生态环境问题之一,土壤侵蚀不仅对人类的生存构成威胁,而且也阻碍了社会的发展。土壤侵蚀的防治,必须建立在土壤侵蚀定量评价制图、掌握土壤侵

学位

泛第三极土地利用水保措施遥感抽样调查

足球场边线外视频转播用自主跟踪机的研究与设计

随着机器人技术的快速发展以及机器学习等技术的逐渐成熟,移动跟踪机器人广泛应用于各个领域,在越来越多的岗位上代替人类完成了复杂工作,实现了生产生活的智能化。本文针对

学位

移动机器人目标检测深度学习MV3-SSD算法自主跟踪

基于深度学习的目标检测网络的压缩及移植

目标检测是计算机视觉的重要组成部分,主要是定位一张图片或者视频中特定物体出现的区域并判断图像中出现的目标类型。随着深度学习的发展,基于深度学习的目标检测在众多领域

学位

目标检测图像预处理轻量型神经网络网络移植树莓派

基于极限学习机和蝗虫群优化的RFID室内定位研究与应用

无线射频识别技术(Radio Frequency Identification,RFID),具有非接触、识别距离远、保密性高、抗干扰能力和环境适应性强等优点。RFID室内定位技术的研究不但具有广阔的市场

学位

无线射频识别室内定位极限学习机蝗虫群算法校园安全监管

基于双流多级注意力感知优化的视频行人重识别研究

其他学术论文