【摘 要】
:
智能视频监控作用越来越突出,其核心技术是事件检测。本文主要研究了与智能视频监控相关的行人检测、事件检测和多GPU并行优化三个方面。行人检测方面,本文提出了一种高效的
论文部分内容阅读
智能视频监控作用越来越突出,其核心技术是事件检测。本文主要研究了与智能视频监控相关的行人检测、事件检测和多GPU并行优化三个方面。行人检测方面,本文提出了一种高效的基于CNN的行人头肩检测方法,该方法建立了检测行人头肩部的级联深度网络(Head-shoulder Cascade Deep Network,HsNet)模型。使用 HsNet 模型检测行人头肩的方案有效地抑制了严重遮挡对检测的影响,且深度网络可以捕捉到头肩部位具有判别性的信息;另外,级联结构提高了检测速度。为促进行人检测算法的研究,我们人工标注了监控视频库TRECVIDSED2008的部分视频,总共得到404,000个行人样本,并将其命名为 SED Pedestrian Dataset(SED-PD)。在 SED-PD 上的实验表明,在拥挤的监控视频中,我们提出的行人检测方法达到的性能可以与当前检测性能最高的方法相媲美;而且,本文方法比其它高性能检测方法速度快。事件检测方面,我们提出基于CNN检测关键姿态的事件检测方法。该方法在2014年的TRECVID SED国际评测的Embrace和Pointing事件检测上分别取得了排名第1和第2的成绩;其改进算法在2015年的TRECVID SED任务中Embrace和Pointing的检测中都取得了排名第1的好成绩。此外,本文还进一步探索了基于CNN的同时利用空域和时域信息进行事件检测的算法。多GPU并行优化方面,在保证相同准确率的前提下,本文实现的异步随机梯度下降算法在LeNet、CifarNet和AlexNet三种模型的训练上加速比分别为1.920、1.724和1.281倍(2块GPU);且其整体性能比另一种多GPU并行算法HogWild高。
其他文献
随着移动互联网应用的普及,用户每天接触的信息量成倍增长,对信息的敏感度下降,这就导致商业服务机构精准地向用户发送用户感兴趣的营销信息变得异常困难。在商业信息服务领
CRAN(Cloud Radio Access Network)是由中国移动研究院从降低网络建设维护成本的角度出发而提出的一种新的无线网络架构方式。在这种架构中,基带处理单元进行集中式部署,形成
在移动互联网迅速发展的背景下,手机电视、视频会议等广播视频业务逐渐成为移动视频业务的新热点。传统数字视频编码中,由于信源信道编码相互分离,无法为不同信道状况、不同
语音识别是由声学模型解码与语言模型解码两部分共同作用下完成的,其中语言模型是语音识别一项重要的技术,也是语音识别当中的重要研究部分。传统的语言模型解码一般采用2-gr
Ⅲ族化合物半导体薄膜的研究在近几年来是一个研究热点,例如氧化镓(Ga2O3)、氧化铟(In2O3)、氮化镓(GaN)、氮化铟(InN)以及三元化合物铟镓氮(InxGa1-xN)。它们都是直接带隙n
X射线脉冲星导航是未来深空自主导航的一种方法,该方法采用脉冲星X射线脉冲作为导航信号源,具有独立性好、使用权不受限制、能够提供精准的时间参考等优点,因此美国、欧洲以
随着信息技术的高速发展,各领域数据的量级呈现爆炸式增长,伴随而来的数据质量问题,如数据失真、数据过期、数据缺失、数据表达不一致等问题,也日益凸显。本文主要研究数据质
随着计算机技术的发展,高校里的设备需要正常的运行,现在高校设备的管理比较混乱,资源分配不平衡,设备闲置非常严重,使用设备管理系统来对设备进行管理可以提高设备的管理水
流程模型差别检测技术作为流程模型管理技术的重要组成部分,已经在流程模型管理过程中得到了广泛的应用。但是,现有的差别检测算法的相关研究存在以下几个方面的问题:1、现有
雾霾天气条件下,由于大气粒子的散射作用导致图像对比度降低、视觉效果较差,一些重要信息被雾气所掩盖而无法识别。因此,去雾技术已经成为图像处理以及计算机视觉领域内研究