基于深度学习的视频行为识别算法研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:cxdyc666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,视频中的人体行为识别越来越受到广泛关注和应用。究其原因,一是深度学习、模式识别等方面的研究有了重大成果;二是随着智慧城市、智能家居等的兴起,社会的智能化发展为人体行为识别提供了广阔的应用前景。所以,既快速又准确地进行视频中的人体行为识别是目前热门的研究方向。人体行为识别的本质是一个多分类问题,其重点是对视频中人体的运动行为进行系统分析,最终人体行为的判断通过合适的分类器来确定。本论文从传统的基于机器学习的行为识别技术出发,引入基于深度学习的人体行为识别技术,通过对两类方法的学习研究、比较分析,再结合二者在实际应用中的表现,研究总结得到了本论文对基于深度学习的人体行为识别方法的改进。论文的主要研究工作为以下几个方面:1.简单介绍了基于机器学习的行为识别技术的发展,分析了几种典型的机器学习算法并总结其优缺点。对基于深度学习的行为识别技术进行综述,回顾其发展历程,重点对视频的时序建模思路进行分析。2.视频行为识别的关键在于长时时序结构建模。本论文采用经典的双流卷积神经网络为基础网络,对其采样方法改进得到时间分割网络。时间分割网络的长时时序建模思路是分割稀疏采样,该方法能够高效地利用整个视频的长时时序信息。本论文的贡献在于在原始的时间分割网络基础上提出多时间尺度的滑动窗口采样方法,解决部分视频中有效视频帧占比小的问题,达到更好的行为识别效果。3.针对视频的时空特性,实验过程中首先提取其时间、空间特征,然后融合得到时空特征。在此基础上,本论文将人类的注意力机制引入时空融合模型,得到基于注意力机制的时空融合特征,使时间、空间信息互为补充,利用整个视频的上下文信息。本论文采用的数据集是行为识别常用的公开数据集,UCF101和HMDB51数据集。整个实验基于深度学习框架TensorFlow完成,从实验结果可知,本论文提出的基于多时间尺度的双流卷积神经网络和基于注意力机制的时空融合模型对于视频的行为识别都取得了较好的识别效果。
其他文献
电影是文化交流的载体。近年来,越来越多的俄罗斯影视剧被中国观众所熟知和喜爱。《绝杀慕尼黑》(?Движениевверх?)就是其中的优秀代表。本报告以《绝杀慕尼黑》字幕汉译为例,结合笔者在字幕组工作经验,总结出影视字幕汉译过程中的策略、技巧,以及影片片名的翻译方法,为今后的翻译实践提供借鉴。报告分为翻译过程描述、字幕翻译策略、片名翻译方法与对白翻译技巧、翻译实践总结四部分。本文着重解决电影字幕翻
本文主要以舟山群岛油品贸易为出发点进行研究。舟山群岛油品储备基地的建成一方面提高了我国应对外部油品市场的变动风险,另一方面旨在通过建立建全油品产业链形成成熟的油品贸易中心,在全球范围内掌握油品的定价权和话语权。目前对内舟山群岛是我国最主要的油品存储与加工地,对外舟山群岛致力于打造东北亚燃油中心,舟山群岛的油品贸易正快速迈向世界的舞台。面对快速扩张的油品贸易,尤其是2018年以来的迅速发展,如何调配
植物园(含植物专类园)属城市公园绿地系统重要内容,是城市文明的标志,植物专类园日益成为人们关注的焦点。随着城市化进程的加快和风景园林事业的发展,我国植物专类园方兴未
黄曲霉毒素B1(Aflatoxin B1,AFB1)是由黄曲霉菌在特定条件下产生的毒性最强的次生代谢产物,广泛存在于玉米、花生等农产品中。槲皮素(Quercetin,QUE)是一种具有抗氧化、抗癌等生
随着高铁产业的发展,利用工业机器人代替人工打磨高铁无缝钢轨焊缝是一种趋势。针对无缝钢轨焊缝形貌特征信息复杂,人工打磨效率低下,以及目前人工作业环境恶劣等问题,建立一
随着人工智能时代的到来,视频人体运动行为识别体现出了广阔的应用价值,包括智能视频监控,虚拟现实,视频检索等。通过分析人体运动行为识别的相关研究,发现已有方法都较难解决视频中存在的复杂背景环境、照明变化、场景变化等干扰问题,且不能有效利用视频帧之间的时序依赖关系,从而影响最终的识别结果。本文围绕以上问题,提出了表征视频前景信息的时空显著性图像,并构建了多流残差神经网络模型,以获取视频中的时空特征和显
林木常与土壤微生物共生以适应复杂的生存环境。真菌与高等植物形成菌根(特别是与树木形成的外生菌根)共生体系是一种极为普遍的现象。随着研究方法的不断发展与应用,菌根真
目的:通过观察加味大黄蟅虫颗粒干预精索静脉曲张合并精液液化异常症的临床疗效,探索其作用机理,为临床治疗精索静脉曲张合并精液液化异常症拓宽临床诊疗思路、提供科学依据,
镁橄榄石(Mg2SiO4)具有高温相稳定、较低的烧结速率和热导率、良好的机械性能等优点,是一种有潜力的热障涂层(Thermal Barrier Coatings)新材料。本论文以Mg2SiO4为研究对象,通过
傅雷是我国著名的翻译大师,他把毕生的精力都倾注在法国文学的翻译上,为读者奉献了巴尔扎克、罗曼·罗兰、梅里美等作家的优秀作品,共计三十余部,洋洋洒洒五百万言字。在众多