一种鲁棒的基于深度数据的行为识别算法

来源 :光电子.激光 | 被引量 : 7次 | 上传用户:sharethesun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别在视频监控和人机交互中具有重要应用,利用深度数据进行行为识别是近年兴起的技术,并取得了一定的进展,但还没有一个公认的、鲁棒性好的行为描述方法,且性能有待提高。针对以上问题,本文提出了3种鲁棒的、深度数据上的行为描述方法,并结合支持向量机(SVM)分类器在两个公开的且具有挑战性的深度数据集上对它们进行评估。实验结果表明,本文提出的行为描述方法具有较好的区分性和鲁棒性,其性能比一些先进的且具有代表性的算法性能更好。
其他文献
提出了一种新的基于图遍历的自适应调色板图像密写方案。将调色板中各颜色视为图节点,利用颜色间的亮度差和欧氏距离,构建颜色图。应用图的遍历为颜色节点,分配秘密比特。嵌入秘密信息的过程中,利用相邻像素颜色间的相关性,建立自适应嵌入准则。对比实验结果表明,提出的密写方案具有较大的嵌入容量,并保持很好的图像质量,与其他的密写方案相比,提出的方案更能抵抗直方图特征函数(HCF)统计分析。
期刊
为了解决当前目标跟踪中目标轮廓提取不精确的问题,在对传统GVF(gradient vector flow)snake活动轮廓模型改进的基础上,提出一种基于变化检测和改进的GVF snake活动轮廓模型的视频目标轮廓提取算法。首先,通过基于t显著性检验的变化检测方法消除背景边界的影响,并获取初始运动变化区域的临界四边形作为GVF snake的初始轮廓。然后,对初始轮廓应用改进的GVF snake模型
期刊
针对总变分去噪模型容易导致阶梯效应的缺陷,提出了一种新的乘性噪声去噪模型。在新模型中,二阶总广义变分(TGV)是正则项,它能自动平衡一阶和二阶导数项,使得新模型在去除乘性噪声的同时不但能够保持图像的边缘信息,而且还能去除阶梯效应。为了有效的计算该模型,设计了一个快速迭代算法。在算法中,首先采用分裂方法和交替方向法将原问题变为两个相关的子问题,然后分别对子问题利用牛顿法和原始-对偶算法。实验结果表明
期刊
针对脉冲耦合神经网络(PCNN)图像融合模型对含噪声图像敏感和融合时间效率不高的问题,通过引入压缩感知(CS)技术对传统模型进行改造,提出了一种融入CS技术的新型快速脉冲耦合图像融合方法,不仅能够弥补传统脉冲耦合模型抗噪声能力不强的缺陷,还可以实现含噪声图像去噪和图像融合同步进行,有效克服了传统去噪融合方法中人为将去噪过程和融合过程分开而造成的信息不一致等问题,在一定程度上提高了融合效果和时间效率
期刊
为了使冗余字典能够自适应地表征图像特征,提出了一种优化的图像字典构造算法。算法采用了冗余字典内基元类之间的灰色关联度作为字典优化依据,建立了一种新的字典优化原则,提出了一种自适应的字典设计算法。算法能够根据图像结构和噪声等信息自适应地选择字典的冗余因子,将算法运用于图像去噪,结果表明,算法效率大大提高,同时也提高了图像去噪效果。
期刊
仿射变换参数恢复轮廓类算法计算量小但一般无法处理多部分组成的目标,而区域类算法计算量大且对噪声敏感。本文利用中心投影将区域和轮廓类算法结合,首先由中心投影将目标转化为闭曲线,保证了仿射变换关系具有不变性,再对所得闭曲线进行参数化,最后利用参数化后的闭曲线进行仿射变换参数的恢复。实验表明,所提方法可用于多部分组成的目标的参数恢复,且有较好的参数恢复效果。
期刊
近日出版的《科学》杂志介绍了迄今最为清晰的人类大脑3D图像,该图像能呈现大脑20微米大小的组织。这个大脑3D图像是"清晰大脑"研究项目的一部分,该研究致力于建立人类大脑高分辨率计算机模型,作为未来研究工作的参照。结合该模型的
期刊
针对目前许多视频对象分割方法中分割边界不精确、遮挡和不规则运动问题解决效果不好等问题,提出一种新的视频对象分割算法。利用人眼的视觉特点,即对运动(时间梯度)和边缘(空间梯度)都特别敏感,把帧间运动变化检测(时域定区间帧差累积)和图像的边缘检测结合起来,首先利用t显著性检验检测对称帧的帧间变化,再对检测出的初始运动变化区域进行时域定区间帧差累积计算,并进一步整合形成记忆掩膜(MT);然后应用改进的K
期刊
高精度眼动记录技术现已非常成熟,但昂贵的价格限制了当前商用眼动仪的应用范围,发展灵活、低成本的眼动记录系统将是眼动跟踪技术的重要研究方向。本文设计了一种低成本、低侵入性的耳麦式眼动记录系统。系统由两个普通CMOS摄像机及耳麦式支架构成,两个摄像机分别记录注视场景图像及人眼图像,成本仅为当前商用眼动仪的几百分之一。针对系统采集的数据,提出一种分段加权环形Hough变换算法提取虹膜轮廓及中心作为特征,
期刊
针对人眼检测过程中存在的表情、光照和眼镜遮挡等干扰因素的影响,提出一种基于Gabor滤波和K-medoid聚类分析的人眼检测和瞳孔定位方法。首先采用鲁棒性较好的眼部横向特征作为检测对象来设计了Gabor滤波器,以突出眼部的横向特征;然后根据Gabor滤波后的眼部特征,并结合K-medoid算法设计了聚类算法检测人眼;在人眼检测基础上,结合灰度分布特征和熵函数设计了瞳孔定位方法。在BioID人脸库和
期刊