基于深度学习的暴力行为识别系统研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:cool_face
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉是深度学习的一个非常重要的研究方向,深度学习可以让计算机拥有类似人类的思考方式。监控覆盖着人们生活的各个角落,可以捕捉暴力发生画面,但保存的监控视频数据总量十分庞大。面对海量的监控视频,需要使用深度学习来进行暴力行为识别,让机器学会识别人类的动作,替代人工监视摄像画面完成暴力行为的报警。网络训练主要采用视频数据集进行识别网络的训练。但目前深度学习存在复杂背景的干扰、光照强度变化等因素的影响,干扰神经网络对特征的提取效果。就暴力行为识别存在的视角差距、光照变化和复杂背景等干扰问题,本文提出使用人体轮廓图作为输入,进行暴力行为识别网络的训练,人物轮廓图可以避免背景干扰和光照等影响。对于人物轮廓图的提取,本文采用Deep Lab V3网络进行语义分割,提取画面中人物所处的像素点,生成二值图。随后使用人物轮廓图进行二维卷积的姿势识别实验,最终能达到83.85%的准确率,证明了人物轮廓图在暴力行为识别中的可行性。针对人物运动速度的研究,本文采用递归全对场变换光流估计算法生成光流图,使用光流图反映人物运动速度。在进行暴力行为识别网络的训练中,本文使用Hockey数据集,采用三维卷积神经网络对RGB图、光流图和人物轮廓图进行暴力行为识别训练,最终准确度分别达到91.9%、91.0%和92.5%,并且在最终的模型集成预测中,达到了94.75%的准确度。三维卷积对时序特征的提取,能获取连续帧内部关系,并提高行为识别的准确率,相较于姿势识别有了8.65%的准确率提升;人物轮廓图相较于RGB图和光流图的识别准确率分别有了0.6%和1.5%的准确率提升,使用RGB+光流图+人物轮廓图的三输入集成模型的准确率比RGB+光流图的双输入模型有了0.35%的准确率提升。
其他文献
21世纪以来,受人们生活水平提高、医疗条件改善以及适龄人口生育意愿降低等复杂因素影响,人口老龄化进入加速阶段,给中国的医疗健康产业和养老服务业带来庞大的刚性需求,尤其是在居家监护和社区护理方面。由于老年患病人口规模庞大,医院等大型机构医疗资源紧张,监护成本高居不下,特别是广大农村地区,医护资源尤其匮乏。针对这些情况,本文研究了基于触摸交互的生理参数监测的应用问题,设计了一套易用性强、便携式的可触屏
随着经济全球化的不断加快,各国和各地区之间的合作也越来越密切,而物流业作为现代经济的“加速器”则发挥着重要的作用,国家也出台了相关政策来支持和推动物流业的发展。虽然经济全球化的进度在加快,但全球经济增速在逐渐放缓,如何有效提高物流效率来提升经济增长的速度显得迫切需要。中部六大城市群位于我国中部地区,在推动中部地区崛起处于战略突出地位,中部地区本身就拥有得天独厚的交通地理优势和优质的综合资源,国家也
随着科学技术的不断发展和进步,各个领域的信息与日俱增,对人们的视觉造成了极大的冲击。人们必须不断地查询和浏览才能获取自己所需要的信息。个性化推荐系统便应运而生,它能主动挖掘用户的兴趣爱好,然后将其展示给用户。在中国的高校领域,信息化、数字化管理已经成为一种趋势。图书馆每天都有大量的学生在浏览、借阅书籍,因此图书馆存储了大量学生的历史借阅数据。有效地利用这些数据,发现其中的关联,挖掘读者的阅读兴趣,
随着机器人技术的快速发展,机器人得到了更广泛的应用,使用的人群也越来越多。面对传统机器人示教编程有着难度高、过程繁琐以及要求用户对机器人相关知识有一定了解的缺点,基于人机交互的直接示教方式被人们所提出。目前最常用的方法是基于末端六维力矩传感器实现的,但其价格昂贵且通用性差,因此需要研究其他方案进行替代,从而降低示教成本及提升示教方式的通用性。针对此问题,本文利用对空间鼠标的二次开发代替力传感器设计
倾斜光纤光栅(Titled Fiber Bragg Grating,TFBG)是一类具有特殊结构的光纤光栅,因其纤芯轴向与光栅栅面间存在一个倾斜角导致其耦合方式发生了改变,使其不仅具备普通布拉格光纤光栅的优点,还有着自己独有的优势。普通FBG对外界环境折射率不敏感,而TFBG由于包层模的存在使其对外界环境折射率十分敏感;使用一支FBG无法解决温度应力等交叉敏感问题,而TFBG可以利用包层模的特性去
随着社会经济和科技的不断发展,智能仓储在柔性制造系统和物流得到广泛的发展,仓储是物流行业中极其重要的一环,因其能提高企业的利润,降低企业运行成本,使仓储的研究成为热门研究。企业的智能化能降低人工成本,有利于企业的持续化发展,AGV智能小车可以代替人工完成拣选作业,AGV具有自动化、灵活性和安全性的特点,能够提高整个制造物流系统的效率。论文在Flying-V布局和Fishbone布局这两种非传统布局
自从机器人问世几十年以来,科学家一直没有对机器人的定义进行统一,主要是因为机器人和人的关系是相互交叉的。1940年科幻学家艾萨克·阿西莫夫提出了机器人三定律,目的是建立以人类为中心的理论,保护人类不受机器人伤害。但是这个理论明显会制约智能机器人进化成人类,所以本文的智能机器人在未来将不会再遵循机器人三定律。本文的引言说明了当前人工智能的发展情况,随着科技的进步,终将会迎来智人时代到强人工智能时代,
根据相关的数理统计,我国年龄在60岁以上的老人已经占全国人口总数的17.3%,依照国际标准中国已经正式步入了老龄化社会。在老龄社会群体中心血管疾病、脑卒中和癌症的致死率极高,而脑缺血和脑失血导致的脑卒中(中风)最为严重,患者在患病过程中和术后存在极大概率伴有相应程度的单侧肢体运动障碍(偏瘫),严重影响患者的日常生活。传统康复疗法不仅在训练方法上存在弊端,还无法实时地对患者肢体进行检测,因此通过康复
室内行人导航能在复杂封闭的室内环境下为行人提供精确的位置导航服务,其研究价值日益突显。论文针对行人导航存在的问题,从惯性多传感器融合方向对室内行人导航方法展开研究,主要研究内容有以下几个部分:论文首先阐述了行人导航的相关理论技术基础。其中,对行人航位推算(Pedestrian Dead Reckoning,PDR)基本技术架构进行了说明,对关键的捷联惯性导航系统(Strapdown Inertia
作为现代化信息系统的技术基础,光纤传感技术现在正处于蓬勃发展的阶段,作为光纤传感器的重要分支的光纤法布里-珀罗(Fabry-Perot)干涉传感器,被广泛地应用于应变、温度、折射率、湿度、加速度、超声波、位移等参数的测量。光纤F-P传感器能够广泛应用于传感领域是得益于其具有结构简单,尺寸小,可靠性高,制作简单,且能够在单根光纤中传输信号等一系列优点。光纤F-P传感器按照其传感头的结构分类,可以分为