基于互相关融合和判别滤波的动物动作识别算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jzg8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动物行为分析是生物学和计算机科学交叉的重要研究方向,其主要通过利用计算机视觉和人工智能技术来自动化地分析动物身体、关节等部位的行为。作为动物行为分析中的重点,动物视频行为识别需要提取出视频中的动作序列的关键视觉特征,然后通过机器学习和深度学习等算法来学习目标动作的时空信息,从而完成对目标动作的视觉内容理解和模式识别。本文面向视频信息中时空动作特征的理解和分析,主要研究其中涉及的视频行为识别算法。针对目前主流行为识别算法中,传统双流网络无法学习非局部时空依赖关系的缺陷以及单流网络在判别关键区域的识别能力的不足,分别提出了互相关融合网络和判别滤波网络。本文的主要研究和工作如下:1.针对传统双流网络无法进行非局部的特征融合的缺陷,提出了基于互相关双流融合网络的动作识别算法。双流网络通过学习图像静态信息和光流运动信息分别得到空间特征和时序特征,并使用后融合结合两者输出从而提高动作识别性能,然而后融合的方式无法学习到这两种特征的非局部依赖关系,即不同区域的“物体”和“动作”的特征关系。本文提出的互相关网络通过引入互相关矩阵来计算两种特征之间的全局响应值,从而可以捕获非局部的时空依赖关系,最后在UCF101人体数据集下取得了95.0%的准确率以及在大鼠行为数据集下取得了99.1%的准确率。2.针对全局平均池化层无法有效捕获到精细行为中判别性区域的缺陷,提出了基于判别滤波单流网络的动作识别算法。深度神经网络通过卷积层来提取视觉特征,并使用全局平均池化和全连接层来进行分类,然而这种方法无法考虑到目标中的判别区域。本文提出利用全局最大池化层和自适应注意力模块,用于检测视觉特征中的判别区域,从而增强网络泛化性,最后在大鼠行为数据集下取得了98.1%的准确率以及在果蝇幼虫行为数据集下取得79.4%的准确率。
其他文献
本文根据我国VTS发展历程及其发展过程中存在的问题,通过对连云港VTS现状的肤浅分析,结合连云港VTS工作人员的知识结构及VTS人员培训具体实践,就VTS人员培训方面提出几点建议
采用不同方式对桃果实进行贮藏试验结果表明,采后果实有机酸是一个先迅速下降,然后逐步回升再逐渐下降的过程,在贮藏20 d左右,糖含量最大,而有机酸含量却最低;贮藏20 d后,糖
在习近平生态文明思想的指导下,重庆市经济绿色化发展有了新内涵、新机遇,同时仍面临严峻挑战。本文立足生态环境和经济发展耦合视角对重庆市经济绿色化发展进行研究,与新常
目的探讨急诊科EICU获得性急性肾衰竭(HA-ARF)的病因和相关因素。方法回顾分析180例ARF患者资料,将其分为HA-ARF组(n=90)与院外获得性ARF(CA-ARF)组(n=90)比较2组资料。结果 HA-ARF组
220kV及其以下电压的变电站已基本全面采用综合自动化技术并无人值守,综合自动化的调试几乎涉及全站所有设备和调度等部门,其全面调试又必需在全站所有设备的安装、调试基本
本文通过对儿童生长发育阶段感知发育特点的探析,结合园林景观场地设计实践提出一些建议,供年轻父母及设计师们参考探讨。
<正>目的通过面罩实行无创正压机械通气治疗重症哮喘,比较两种不同模式无创正压机械通气(NIPPV)在应用中疗效的差异,评价其临床价值。方法我院2002年5月-2020年8月采用面罩无
会议
学校课程管理是一个由内部核心层的课程规划、中间执行层的课程实施和外部庇护层的反馈调控的三者有机结合的三重结构。理念、目标、内容是整合性课程规划的三大要素,课题推动
主动脉夹层是一种危及生命的急症,需要及时有效的临床干预。CT血管成像(CTA)广泛应用于主动脉夹层的诊断及术后随访过程中。主动脉夹层CTA特征性表现是腔内掀起的内膜片影及
会议
试验考察常温条件下,分析了4格室厌氧折流板反应器(ABR)处理生活污水的效果。研究结果表明:水力停留时间(HRT)为3~15 h,随着HRT增加,对COD去除效果逐渐提高,当HRT为12 h以上时,对C