基于深度学习的行人属性及异常行为识别的研究与实现

来源 :深圳大学 | 被引量 : 0次 | 上传用户:wingkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉技术的快速发展为海量监控数据提供了多种自动化分析解决方案,就行人信息而言,现有的解决方案多是专注于目标检测、目标跟踪等低层算法,因此行人信息的分析方法仍待向中高层算法方向继续深入研究。由于行人的特性可通过年龄、性别、携带物等属性来推断,行人未来的意图能通过当前时刻的具体行为来预测,因此研究行人属性识别与行人异常行为分析对智慧安防等领域有着重要的意义。为了在真实监控场景下能更加鲁棒地提取出行人的中高层语义信息,本文顺应当前计算机视觉技术的发展趋势,利用深度学习方法,重点面向监控场景下的行人属性识别和行人异常行为识别技术进行了研究。具体研究主要工作如下:1.在行人属性识别任务中,本文提出了一种基于局部注意力机制的行人属性识别算法,该算法能有效识别行人的多种属性。为了能直接对监控场景下的行人进行属性分析,算法首先利用基于关键点的目标检测算法进行行人目标检测。然后,算法引入行人结构分布的先验信息对目标行人的局部图像和全局图像进行建模,并利用基于通道和空间的注意力机制残差网络加强对目标行人有效区域特征的提取,减少行人背景区域的干扰。为解决数据集中属性分布不均衡的问题,算法引入了改进的二值交叉熵函数进行属性分类。该算法对基于关键点的目标检测算法进行微调,能更好地识别有效行人。该算法在Market-1501数据集和自建的真实场景属性识别数据集中进行了测试,实验结果表明,本算法能较好的识别出行人的12种属性。2.在行人异常行为识别任务中,本文提出了一种融合人体骨架空时特征和行人表观语义特征的基于人体骨架特征的行人异常行为识别算法,该算法能有效识别行人的异常行为。该算法主要由空时域骨架特征提取网络和行人表观语义特征提取网络组成。在空时域骨架特征提取网络中,首先设计了一个骨架序列生成模块,以提取出视频中每个行人的骨架序列。然后利用长短期记忆网络和图卷积网络构建出人体骨架序列的时序特征和空间特征,其中长短期记忆网络和图卷积网络都采用层次化堆叠的方式对骨架的关节片段进行特征提取。为了提升识别的鲁棒性,本算法在网络中还引入了行人RGB序列表观语义特征。最后,将空时特征和表观语义特征进行融合,并利用含有softmax的全连接神经网络实现行为分类。此外,本文所提出的算法在自建数据集上进行了评估。实验结果表明,本算法能在真实监控场景下对本文所定义的3种行人异常行为进行识别。3.本文设计了一套基于深度学习的行人属性及异常行为识别系统。该系统采用模块化结构进行搭建,采用Py Qt5进行图形用户界面设计,利用基于局部注意力的行人属性分析算法和基于骨架空时特征的行人异常行为识别算法实现了行人属性识别和行人异常行为识别两大功能。通过行人属性及异常行为识别系统的设计,验证了本文提出的行人属性识别算法和行人异常行为识别算法在真实场景下的有效性。
其他文献
我国经济进入高速发展阶段,在居民的物质生活水平得到稳步提升的同时大众对于精神文化的需求也在不断增长。因此,能为大众提供集中性的文化娱乐产品体验及服务的建筑——城市文化综合体应运而生并逐渐融入大众的生活当中。在城市文化综合体内由个体经营的具有特色、风格、文化等特征,涵盖餐饮、画展、讲座、音乐、文创产品等为一体复合式经营的独立书店,满足消费者阅读、餐饮、逛游、休息等物质需求与精神需求相结合的多元化经营
当前人们对海洋资源的探索和开发与日俱增,水下机器人技术也随之飞速发展。为了更优越的性能,人们加大了对仿生机器人的研究,仿生机器海豚已成为当今的研究热点之一。机器海豚可以在许多领域发挥着重要的作用,比如资源探测、泄露检测、水质检测、军事探索和攻击等。目前多数的机器海豚是采用地面站进行控制运动的,但是现阶段水下无线通信技术多数存在着一定的延迟,难以实时传输数据和控制指令。为了使机器海豚能够自主游动,可
仿生系列智能机器人发展以来,主要分为陆地机器人、水下机器人和空中飞行无人机三大类。其中无人机与陆地机器人发展迅速,而水下机器人有几大研究所进行研究,并因在水下水质质量检测、水下空间构建、生态数据采集、军事信息传输等一系列工程应用得以加重关注。现有研究的水下仿生机器人推进方式主要以身体/尾鳍(body and/or Caudal Fin,BCF)和中央鳍/对鳍(Median and/or Paire
图像隐写术是多媒体安全领域中的一种常用技术,它主要通过对图像载体的像素值或DCT系数的轻微修改来嵌入秘密信息。随着图像隐写术的发展,隐写分析术的目的则是检测图像中是否存在秘密信息。隐写和隐写分析一直在对抗博弈中共同发展,基于最小失真框架的隐写和基于有监督学习的隐写分析成为主流的研究方法。为了提高隐写的安全性能,图像内容自适应隐写算法将修改集中到隐写分析器难以建模的纹理复杂区域。随着深度学习技术在图
二维码由于其成本低和使用方便等特性,得到了广泛应用。为了抵抗非法复制(Illegitimately-Copying,IC)攻击,现有的防复制二维码通过隐藏认证信息来提高其安全性,如最新提出的:2LQR二维码(Two-Level QR code)、LCAC二维码(Low-Cost Anti-Copying 2D barcode)和STAC二维码(Superimposed-Tag Anti-Copyi
随着高效的视频编码技术和计算机网络的普及,数字视频已经渗透到人们生活的方方面面。视频一方面作为娱乐产品丰富人们生活,另一方面在司法取证和公共安全中也扮演着重要的角色。视频处理技术的发展和视频编辑软件的涌现,使得普通用户轻易就可以完成视频内容的修改。不法分子通过篡改视频内容达到造谣、嫁祸他人目的的案例越来越多。因此视频原始性取证分析技术对个人权益和社会的稳定都具有重要的作用。本文针对视频原始性证实的
深度学习近年来得到了快速的发展,在计算机视觉,自然语言处理等众多领域有着优越的表现,催生了一系列智能产品的落地。而深度学习的本质是在大数据支撑下,由多层神经网络堆叠形成的信号处理系统,具有参数量大,计算复杂度高等特点,需要依靠高性能的服务器端来处理庞大的网络参数运算与更新。很多时候,出于响应时间、隐私方面和服务稳定性的考虑,更希望将这些网络模型放在移动终端上运行,而移动终端的运算资源及计算能力有限
模型压缩与优化是当下深度学习领域的研究热点之一,致力于解决深度神经网络(Deep Neural Network,DNN)模型过度冗余,参数过大导致的运算量或存储要求过高的问题。当前主流的基于低秩与稀疏分解的网络压缩方法没有整体考虑权重的这两种特性,忽略了它们之间的关联。其次,模型压缩涉及的超参数,如秩、稀疏度等的搜索空间极大,高度依赖领域专家经验进行选择。此外,在稀疏网络的学习中,网络连接结构与模
随着计算机技术和互联网的发展,视频正成为人们获取和交流信息的主要载体,其中视频监控越来越成为社会发展和人们生活不可或缺的一部分,如何使用计算机技术进行视频中的人类行为分析识别成为近年来的研究热点。本文在以光流信号为运动信息表征的传统双流卷积神经网络的基础上,提出以帧间差分图像序列作为时间流网络输入,运用Res Net-18网络结构建立双流网络模型实现视频中人体行为识别的方法。并对传统双流网络的数据
由于二维码独特的光学可见性,容易受到非法复制(Illegitimately-Copying,IC)的攻击。IC攻击不仅阻碍了二维码的推广使用,也对商家和用户造成了不可避免的经济损失。早期的防复制二维码主要利用特殊打印材料或特殊打印技术来设计的,导致了以下缺陷:生产成本高和通用性低。最近,有研究者通过分析非法信道特性,提出了新的防复制二维码,比如2LQR二维码(Two-Level QR Code)和