基于深度递归分层条件随机场模型的人体行为识别

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户：randomx1

【摘要】

：

人体行为识别是计算视觉与模式识别领域中一个重要课题,在视频监控与视频检索中有着广泛的应用。近年随着技术进步,廉价的RGB-D相机(如Microsoft Kinect)能够捕获三维场景中

【作者】

：

王新城

【机构】

：

南京邮电大学

【出处】

：

南京邮电大学

【发表日期】

：

2016年期

【关键词】

：

线性链条件随机场深度递归分层条件随机场结构化支持向量机平均场近似块-坐标原始-对偶弗兰克-沃尔夫算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体行为识别是计算视觉与模式识别领域中一个重要课题,在视频监控与视频检索中有着广泛的应用。近年随着技术进步,廉价的RGB-D相机(如Microsoft Kinect)能够捕获三维场景中丰富的时空信息。研究者建模时空交互信息,可以更便捷地学习复杂人体行为结构。人体行为识别的早期研究工作,通常以2D视频作为感知数据源;但是,2D视频提供的信息有限,即使在没有遮挡的情况下,也会导致相对较低的识别准确率。本文使用RGB-D传感器捕获RGB视频和深度视频,以人体姿态与交互物体的共生关系和几何约束为基础来识别人体行为动作。首先采用人体骨架来描述行为主体,以骨架中各个节点为中心划分局部区域边界框,将各个边界框定义为人体的各个组成部分;然后分别对各个边界框区域提取HOG-3D特征,并将其作为人体姿态特征;最后将人体姿态特征、物体的位置与形状特征、行为主体与物体交互特征等特征串联组合成最终的特征向量,并将此特征作为每个行为视频段对应的观察数据。线性链条件随机场(Linear-chain CRFs)作为一种判决模型,广泛应用于人体行为识别。由于其能够在时间维上捕获目标状态之间的一阶或数阶相互依赖关系,因此在对时间序列进行标注的工作中表现出良好的预测性能。但是现有的条件随机场模型无法捕获目标状态内部的中间表示,以及状态之间的高阶相关性。而这些信息在对复杂的行为识别场景中通常会表现出潜在的重要性和显著性。为克服这一难题,本文提出了一种深度递归分层条件随机场模型(Deep Recursive and Hierarchical Conditional Random Fields,DR-HCRFs)模型。该DR-HCRFs模型能够目标状态内部丰富的语义信息,以及目标状态之间无穷阶的相关信息。同时,为精确推理模型以及降低模型的计算复杂度,本文提出了一种基于平均场近似(mean-field-like)理论的模型推理方法。最后,本文分别使用割平面(Cutting-plane),弗兰克-沃尔夫(Frank-Wolfe,FW)算法和块-坐标原始-对偶弗兰克-沃尔夫(block-coordinate primal-dual Frank-Wolfe,BCFW)优化方法驱动的结构化支持向量机(Structural-Support Vector Machine,SSVM)分类器学习关于人体行为序列的判别分类模型。通过在CAD-120数据集上的实验可以发现,本文提出的人体行为识别框架相比其他先进方法表现的更为出色,且面对不同数据具有较大的扩展性。

其他文献

配电自动化中通信系统的设计与评价方法的研究

随着国民对电能质量要求的不断提升,我国开始逐步优化配电网的结构,各个地区先后推行配电自动化系统。通信网络作为配电自动化系统的支撑部分之一,在配电自动化系统的建设中也成为重点关注与讨论的部分。因此,如何规划配电自动化中的通信系统也成为配电自动化系统建设的重要组成部分。通信网络建设的经济性及技术性成为影响配电自动化系统实施的关键点之一。基于此,本文给出配电自动化建设中通信系统的设计原则及规划步骤。同时

学位

配电自动化通信系统性能指标带偏好的DEA投资分析

高效视频转码的关键技术

随着社会的不断信息化,多媒体通信成为人们日常信息交流的一种重要手段。由于多媒体信息尤其是视频信息数据庞大,因此对多媒体信息进行数据压缩是实现多媒体通信应用的必要环

学位

H.263MPEG-4视频转码单指令多数据运动矢量映射

OFDM系统降低峰值平均功率比技术研究

正交频分复用(OFDM)是一种高速传输的多载波调制技术,具有良好的抗多径衰落能力和较高的频谱利用率,适用于无线高速和多媒体数据的传输,是第四代移动通信的核心技术之一。但

学位

正交频分复用峰值平均功率比选择性映射扰码序列

基于对象的视频摘要关键技术研究及实现

随着科技的发展以及我国安保工作日益增强,各地监控视频的数量呈几何形式的增长,在这种情况下,能够实现视频压缩,将不同时间不同空间中出现的物体在尽可能短的时间内同时播放

学位

技术框架数据结构能量约束最小化算法图像融合聚类算法

图像颜色迁移技术的研究

评价图像颜色迁移的研究成果主要体现在:(1)处理效果,处理后的结果图像颜色是否自然和谐、画面逼真,这是衡量颜色迁移最重要的指标;(2)处理效率,人工参与量的多少和计算机处

学位

颜色迁移图像聚类域值分割自动分割颜色迁移软件系统

岸舰双/多基地地波超视距雷达机动目标的检测

岸舰双/多基地地波超视距雷达(CSB/M-SWOTHR)发射天线阵架设在海岸，每个天线发射信号的载频不同，并且相互正交，从而在功率意义上不形成发射方向图。接收天线在移动的舰船上，接收

学位

地波超视距雷达机动目标检测海杂波展宽电离层干扰

Ad-hoc网络的安全机制研究

近年来,随着无线通信技术快速发展以及Ad Hoc网络技术的应用范围不断拓展,针对Ad Hoc网络路由的研究也日益成熟,AODV路由协议由此孕育而生,然而AODV设计之初并未充分考虑诸多

学位

无线通信通信网络网络路由通信协议

基于时空信息的视频目标跟踪算法研究

目标跟踪是计算机视觉中一个重要的研究领域,在智能视频监控以及人机交互等应用领域中也发挥着巨大作用。但是,受到一些内在因素(如目标姿势改变、形状改变、尺度变化)和外在

学位

目标跟踪时空信息自适应特征选择轨迹置信联姻模型置信图平滑约束峰值旁瓣比更新轨迹

RF直放站数字中频技术的研究及实现

在蜂窝移动通信系统中,直放站作为移动通信网络优化的重要设备,已经在2G、3G网络中得到广泛的应用,它在增强信号覆盖、降低网络运营成本等方面起着重要的作用。作为直放站的

学位

直放站数字中频FPGA自动增益控制

基于OFDM技术无线视频传输设备的研究

随着无线通信技术的日益发展,传输带宽的不断提高,通信终端的实时信息处理能力飞速增强,无线化已经成为视频采集领域的新的发展方向。3G的大规模商用使得相关的无线视频采集

学位

视频采集嵌入式OFDMWLAN

基于深度递归分层条件随机场模型的人体行为识别

其他学术论文