融合时空注意力深度模型的行为识别

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:resiaton
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的行为识别是指将特定行为类别从视频中识别出来的过程,在视频监控,视频检索,人机交互领域有广泛的应用。但是大多数方法仍然受限于视频中复杂背景,从而造成行为识别任务仍然遭受巨大的困难和挑战。对此问题,我们将关注度机制与基础的行为识别模型相结合,搜索深度学习的网络结构,抑制背景信息的干扰,提高行为识别模型在复杂干扰视频中的识别能力。本文的贡献如下:(1)课题整理了行为识别在传统特征,CNN模型,RNN模型方法上的研究现状,并重点阐述了Resnet和LSTM的深度学习基础模型,最后简要介绍了注意力机制相关内容,为本课题融合注意力的深度学习模型奠定了理论基础。(2)针对视频中存在冗余帧,降低了行为表达的可靠性,本文提出了一种新的基于顺序验证的时间关注度LSTM的行为识别模型。该模型设计支持向量机来判别视频帧之间的顺序关系,并通过对该顺序关系进行时间池化来学习每一帧的时间关注度,从而获得增强后的行为表达,达到抑制低质量冗余帧的作用。在获得增强特征之后,利用LSTM学习行为特征之间的时序依赖关系。实验在UCF101和HMDB51两个公认的数据集上进行验证,能够实现可靠的行为识别。(3)针对单个视频帧上的空间背景信息,我们在网络结构的预处理阶段,加入空间关注度模块,提出一种基于时空关注度双流网络的行为识别方法。该模型设计融合平均池化和最大池化的卷积结构实现空间关注度,用于抑制空间背景。实验在UCF101和HMDB51两个公认的数据集上进行验证,能够进一步实现行为识别性能的提高。
其他文献
农业是保障我国经济可持续发展和社会的繁荣稳定发展的重要产业基础。近年来,随着国际贸易的广泛进行,我国粮食生产和销售受到国际市场各种因素的影响。在粮食需求增加的同时
非圆齿轮传动系统可用于传递两轴间的变速运动,与凸轮和连杆等变速机构相比,具有传动平稳、结构紧凑、运动精度高、传动功率大及传动效率高等优点,在解算装置、自动化仪器仪
近年来,社会经济发展飞速,人民生活质量提高,水环境问题随之浮现。为应对水环境问题,我国在“十三五”规划中提出并深化了水处理行业的提质改造和污泥处置工作。为响应“十三
自20世纪50年代初推出以来,智能车辆已成为智能交通系统中必不可少的技术,然而商用自动驾驶车辆的精确定位仍然是一个关键的问题。智能车辆在行驶过程中,定位是最基本的信息,
文化是民族的血脉和灵魂,是国家发展、民族振兴的重要支撑。优秀传统文化是中华民族现代精神支柱的血脉和源泉。而中华民族现代精神支柱是凝聚和团结各族人民,激发创造活力,
会议
α-半乳糖苷酶(α-Galactosidase)是一种通过分解糖分子中非还原性末端的α-1,6-半乳糖苷键从而消除豆类中的抗营养因子,提高营养素利用率的酶,它可以直接水解蜜二糖因此又叫蜜二糖酶。本论文从不同的样品中筛选分离可产α-半乳糖苷酶的微生物,以寻找更多具有不同酶学性质的的α-半乳糖苷酶。从腐乳中分离得到一株可产α-半乳糖苷酶的细菌菌株,并对所得菌株的产酶条件和酶学性质进行研究,主要实验内容
目的:建立桂蒲肾清片中胆酸的含量测定方法。方法:采用反相高效液相色谱法,HypersiL ODS柱(4.6mm×250mm,5μm),0.02%磷酸-乙腈(70∶30)作为流动相,流速设置为1mL·min-1,210
二十一世纪,互联网蓬勃发展。网络通信成为人们交流的主要渠道,人们通过网络获取信息时也面临着泄露信息的风险。因此,保证信息安全,对信息进行认证已成为密码学中的热点课题
钢筋混凝土简支梁是工程结构广泛使用的混凝土典型构件,其承载能力需满足设计要求,保证足够的安全性和稳定性,极限承载力的判定对混凝土工程的设计、加固以及结构的安全度评