基于时空注意力机制的行为识别方法

来源 :中国体视学与图像分析 | 被引量 : 0次 | 上传用户:asfaweawrv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能信息时代的到来,视频人体行为识别受到越来越多的重视。现有的行为识别方法大多考虑在数据形式或网络结构上进行改进,取得了不错的性能。受到人类在观察行为时的启发,人类会重点注意到关键区域和关键时刻,我们提出了一种新的基于时空注意力机制的行为识别方法。对于空间信息,关键区域提取模块得到重点区域,并结合全局信息进行识别。对于时间信息,设计了时间特征重标定模块,使不同时刻的特征具有不同的权重。在广泛使用的数据集上进行的实验表明,与先进的方法相比,我们的方法取得了最好的性能。
其他文献
Using the rich deep seismic sounding data recorded in the middle part of the NorthSouth Seismic Belt in China,the horizontal and vertical profiles are constructed to obtain the seismic velocity struct
期刊
With the more complete acoustic emission(AE) catalog improved by the multi-channel AE matched-filter technique(MFT),we study the spatiotemporal evolution of the AE activities after laboratory stick-sl
期刊
|全自动遮雨棚|全自动遮雨棚应用在水分控制试验上。降雨、降雪自动关闭,天晴自动打开。可以内安装人工模拟降雨等扩展系统。|土壤水分控制池|土壤水分控制池是一项重要的土壤生态监测设施,应用于植物控水实验,根系观测。|水面自动蒸发站|水面蒸发作为蒸发能力的表征,是水资源评价工作必须涉及的分析内容,实现自动化测量日蒸发量。根据要求可制作各种面积的自动蒸发站。|蒸渗仪|高精度称重蒸渗仪采用差分式双称重系统,
期刊
在铸造领域,熔体在凝固过程中因体积收缩可能会形成气孔,进而影响压铸制品的功能——这是任何压铸件厂商都不愿意看到的事。自2016年以来,Gruber&Kaja公司使用AUTFORCE公司的多相机系统,能够可靠检测出350×400mm的压铸件中直径在0.4mm以上的气孔,以确保为客户提供无气孔的铝压铸件。借助6台堡盟LX系列工业相机,专业人员成功地解决了一个被认为不可能通过自动化来完
期刊
视频图像是公共安全防范及其他众多领域进行信息分析的重要基础数据,然而很多关键场景的环境光照条件复杂,甚至接近于漆黑,从而导致所获取的视频图像不够清晰,难以辨认目标特征而失去其实用价值。对于某些特定场合,补光设施的应用或许可以解决一部分问题,但会带来部署维护的成本上升以及光污染等问题。如何让摄像机本身在低照度环境下获取更高质量的视频图像,各大厂商进行了不懈的努力。从器件入手,采用更大的光圈镜头和更灵
期刊
国土空间规划管理信息化方案,整合叠加各级各类国土空间规划成果,有效支撑规划编制、审批、实施、监测、评估、预警、公众服务等国土空间规划全过程,为统一国土空间用途管制、强化规划实施监督提供法定依据,同时提供基于"多规合一"的自然资源全业务流程管理、多审合一、多测整合、全程监管以及综合办公等服务。
期刊
扩散张量磁共振成像(DT-MRI,简称DTI)是一种能够对脑组织中复杂的白质纤维束进行观察和追踪的一种特殊形式。而针对DTI对噪声和灰度敏感,传统的分割方法难以对脑组织进行精确分割的特点,设计了一种基于图像相似度的多权重图谱DTI自动分割算法(MAPS)。MAPS是在MAIS的基础上通过分割图像的自相似性及引导滤波进行优化的方法。结果为MAPS分割的重叠率要优于MAIS大约6%,并且MAPS的分割
期刊
视网膜血管自动分割能辅助诊断某些眼底疾病和系统性血管疾病。为了提高血管自动分割的效率,因此提出了一种线算子引导Gabor小波的视网膜血管分割方法。利用线算子检测血管方向的最优匹配角,将其作为Gabor小波变换的旋转角构建4个不同尺度的Gabor小波,并提取4维Gabor小波特征,加上两个线强度和预处理后的图像灰度,构建7维特征向量,采用SVM进行分类。与其他基于Gabor小波的方法相比,本方法只需
期刊
随着多媒体技术的发展,人脸编辑越来越受到人们的关注和重视,是计算机视觉和机器学习领域的热点和难点问题。现有的人脸编辑算法未充分利用人脸结构信息,往往导致人脸编辑结果不真实可信。为此,本文提出了一种显式利用人脸结构信息的算法来编辑人脸眼睛部位,该算法基于二阶段生成对抗网络(Generative Adversarial Networks,GAN):首先生成眼睛和瞳孔的结构信息;然后利用这些结构信息来指
期刊
振铃抑制问题是鲁棒的模糊核估计中的关键问题。针对该问题,本文提出根据核估计迭代中潜在图像内振铃和真实图像结构的变化特性对二者进行区分。根据观察,潜在图像内的真实图像结构能够在迭代中稳定保持,振铃却随着核估计而不断变化。在本文所提方法中,我们利用迭代过程中潜在图像的序列来提取对于核估计有利的结构。实验结果表明,本文所提出方法相比现有的图像盲复原方法,在仿真图像数据和真实图像数据上表现更加优异,算法更
期刊