压缩域视频分析技术研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:wmr8232123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,人们正在处于一个数据爆炸的时代,而在海量的信息中,视频数据和图像数据占据了很大的一部分。为了存储、传输和处理这些数据,计算机需要消耗相当大的空间资源和计算资源,因此有必要采用压缩技术来减少视频和图像的数据规模。近年来,压缩域技术的主要发展方向有两个,一个是视频压缩标准技术,如H.264和HEVC,另一个是压缩感知。压缩域技术的应用场景很多,其中包括目标跟踪、视频显著性检测和人脸活动单元识别,本文主要对上述三方面的相关问题和算法进行了研究。
  压缩域跟踪是直接从压缩码流中提取运动矢量和块编码模式来实现目标对象的跟踪。针对现有压缩域跟踪方法对小运动目标跟踪性能较差的问题,本文提出了一种面向小运动目标的压缩域跟踪算法。在分析现有算法不足原因的基础上,本文从起始帧掩模的获取、离群值边界的设置和预测跟踪小目标的边缘控制三个方面提升小目标跟踪的性能,并通过数据驱动的方法寻找到块编码感知的系统参数优化。所提算法在三个小目标视频序列上进行了测试,实验结果表明,与其它压缩域跟踪算法相比,本文算法可以有效地提高小运动目标跟踪的准确率和F度量。
  为了预测人眼的关注区域,显著性检测得到了广泛的研究,在计算机视觉和图像处理中有多种应用。面向压缩域的显著性检测,本文阐述了如何在最新的高效视频编码(HEVC)压缩域中生成有用的特征,也即利用分裂深度、比特分配和运动矢量来计算出相关的HEVC特征,从而生成视频显著性图。同时,本文还基于实验结果的分析,提出了一种HEVC压缩域双SVM模型的视频显著性检测方法,该方法结合了压缩域视频显著性检测的优势和像素域显著性检测的特点,可以计算出更准确的视频显著性图。
  人脸活动单元(Action Unit, AU)对分析和辨别复杂人脸表情是行之有效的。本文研究了两种基于压缩感知的人脸活动单元识别算法,通过利用不同的先验概率模型,两种算法的AU识别率和复杂度各有优势。除此之外,本文还从算法的实时性角度对两种算法进行了优化分析。
其他文献
包装设备是工业生产的重要环节,随着自动化技术的发展,包装设备正在向高智能化、多功能、高效率及低功耗方面发展,药品装盒机是包装设备的一种,用于实现药品自动装盒及包装。  本文对药品装盒工作流程和控制要求进行了分析,从结构和控制两方面对设备功能进行了设计,控制单元的主控制器采用西门子公司的S7-200系列的PLC,通过采集气缸的磁性开关、位置开关、旋转编码器等信号,实现对气动单元、输送电机和伺服电机的
电网结构的复杂化进一步提高了人们对电网的可靠运行、状态的实时监测的要求。传统的量测系统可实现系统的常规监测,但其实时性差,且难以实现数据的相量测量。同步相量测量PMU(phasor measurement unit,PMU)的应用为保证系统的实时监控提供了重要条件。相对于传统的量测,PMU具有较高的测量精度及频率,能够获得测量数据的电压电流相量值。PMU对监测电力系统的安全运行具有重要的作用。同时
学位
分布式电源发电具有环保和灵活等优点,发展含分布式电源的微电网被认为是实现电网智能化、网络化的关键举措,它能够使系统的可靠性及其灵活性得到提高。但是分布式电源的发电方式具有间歇性和不可预测性,会影响电网的电能质量。微电网的运行存在并网和孤岛两种模式,只有实现在以上两种运行模式切换时平滑过渡,才能保证持续的稳定运行和电能质量。  本文根据微电网的结构特点和并网、孤岛运行方式的特征,介绍了微电网的模式切
学位
永磁同步电机有着起动转矩大,过载能力强,运行可靠,同功率下其体积更小的优点。由于永磁同步电机转速低、扭矩大,可以直接驱动设备,提高传动效率,降低设备故障率,因此在矿井的皮带运输机得到了较好的应用。变频永磁同步一体机应用在井下的皮带运输机后,煤炭运输环节运行可靠顺畅,生产效率大幅提高。  本文结合生产实际,设计了1140V防爆水冷永磁同步变频一体机,介绍其结构特点和变频控制理论,对变频控制及电机本体
学位
信息化时代的快速发展,使得移动通信业务对我们的生活越来越重要。通信基站作为移动信息传递的枢纽自然受到重视,而蓄电池组作为通信基站电源的重要组成部分,在交流电源失电时其作为后备电源的可靠性显得格外重要,所以对蓄电池组进行实时监测有着重要的现实意义。  本文从通信基站蓄电池监测的具体要求出发,设计了一种运行稳定、人机交互界面友好、监测精度高的蓄电池在线监测系统。该系统主要分为两个部分:蓄电池监控单元和
学位
[db:内容简介]
矩阵变换器是一种先进拓扑结构的“全硅”功率变换器,它允许频率单级变换,无需大容量的贮能元件,而且输入电流、输出电压正弦,输入功率因数可达到0.99以上并可自由调节,能量可双向流动,是一项具有节能、环保优势的新技术,具有巨大的研究价值和广泛的应用前景。本文对矩阵变换器的实现方式进行了研究。本文首先研究了矩阵变换器的基本工作原理,对当前常用的矩阵变换器控制方法进行了归纳总结,可以根据控制量的不同,分为
当今世界通信科学技术飞速发展,通信频谱资源越发珍贵,认知无线电技术(CR)的出现极大地提高了频谱的利用效率,它可以监控其他用户占用频谱的情况,通过分析和判断监控到的信息,找出未被占用的频谱进行网络通信,使系统达到最优的频谱利用效率。目前除了稀缺的频谱资源外,用户之间的干扰是限制系统容量提升的又一大问题,干扰对齐(IA)技术在消除干扰方面有着出色的表现,其主要原理是将来自非目标发射机的信号对齐到同一
近年来,蜂窝网数据流量需求高速增长,移动运营商们通过部署大量基站来提高蜂窝网的网络容量及传输速率,为用户提供更优质的网络服务。与此同时,大量的基站造成了巨大的能量消耗,为移动运营商带来了高额的能耗成本。本文从经济角度出发,研究分析了蜂窝网中基站长期能耗成本的优化策略。  本文提出了一种结合可再生能源、本地发电机、分布式储能装置及集中式电网混合能源供电的并网型基站模型,并考虑了双时间尺度模型下的基站
学位
基于视频的人体动作识别在监控安全、视频内容分析、行为分析、人机交互等应用领域具有极大的应用价值。但因为动作难以定义、场景复杂、动作差异、模型泛化能力等问题,人体动作识别仍然是计算机视觉领域亟待攻克的难关。针对不同的动作识别应用场景和不同的识别问题,基于三维卷积神经网络提出了不同的动作识别算法。本文的工作内容分为以下三个方面:  (1) 针对传统网络欠缺动态特征捕捉能力和时域全局关联能力的问题,提出