论文部分内容阅读
随着互联网技术的快速发展,人们正在处于一个数据爆炸的时代,而在海量的信息中,视频数据和图像数据占据了很大的一部分。为了存储、传输和处理这些数据,计算机需要消耗相当大的空间资源和计算资源,因此有必要采用压缩技术来减少视频和图像的数据规模。近年来,压缩域技术的主要发展方向有两个,一个是视频压缩标准技术,如H.264和HEVC,另一个是压缩感知。压缩域技术的应用场景很多,其中包括目标跟踪、视频显著性检测和人脸活动单元识别,本文主要对上述三方面的相关问题和算法进行了研究。
压缩域跟踪是直接从压缩码流中提取运动矢量和块编码模式来实现目标对象的跟踪。针对现有压缩域跟踪方法对小运动目标跟踪性能较差的问题,本文提出了一种面向小运动目标的压缩域跟踪算法。在分析现有算法不足原因的基础上,本文从起始帧掩模的获取、离群值边界的设置和预测跟踪小目标的边缘控制三个方面提升小目标跟踪的性能,并通过数据驱动的方法寻找到块编码感知的系统参数优化。所提算法在三个小目标视频序列上进行了测试,实验结果表明,与其它压缩域跟踪算法相比,本文算法可以有效地提高小运动目标跟踪的准确率和F度量。
为了预测人眼的关注区域,显著性检测得到了广泛的研究,在计算机视觉和图像处理中有多种应用。面向压缩域的显著性检测,本文阐述了如何在最新的高效视频编码(HEVC)压缩域中生成有用的特征,也即利用分裂深度、比特分配和运动矢量来计算出相关的HEVC特征,从而生成视频显著性图。同时,本文还基于实验结果的分析,提出了一种HEVC压缩域双SVM模型的视频显著性检测方法,该方法结合了压缩域视频显著性检测的优势和像素域显著性检测的特点,可以计算出更准确的视频显著性图。
人脸活动单元(Action Unit, AU)对分析和辨别复杂人脸表情是行之有效的。本文研究了两种基于压缩感知的人脸活动单元识别算法,通过利用不同的先验概率模型,两种算法的AU识别率和复杂度各有优势。除此之外,本文还从算法的实时性角度对两种算法进行了优化分析。
压缩域跟踪是直接从压缩码流中提取运动矢量和块编码模式来实现目标对象的跟踪。针对现有压缩域跟踪方法对小运动目标跟踪性能较差的问题,本文提出了一种面向小运动目标的压缩域跟踪算法。在分析现有算法不足原因的基础上,本文从起始帧掩模的获取、离群值边界的设置和预测跟踪小目标的边缘控制三个方面提升小目标跟踪的性能,并通过数据驱动的方法寻找到块编码感知的系统参数优化。所提算法在三个小目标视频序列上进行了测试,实验结果表明,与其它压缩域跟踪算法相比,本文算法可以有效地提高小运动目标跟踪的准确率和F度量。
为了预测人眼的关注区域,显著性检测得到了广泛的研究,在计算机视觉和图像处理中有多种应用。面向压缩域的显著性检测,本文阐述了如何在最新的高效视频编码(HEVC)压缩域中生成有用的特征,也即利用分裂深度、比特分配和运动矢量来计算出相关的HEVC特征,从而生成视频显著性图。同时,本文还基于实验结果的分析,提出了一种HEVC压缩域双SVM模型的视频显著性检测方法,该方法结合了压缩域视频显著性检测的优势和像素域显著性检测的特点,可以计算出更准确的视频显著性图。
人脸活动单元(Action Unit, AU)对分析和辨别复杂人脸表情是行之有效的。本文研究了两种基于压缩感知的人脸活动单元识别算法,通过利用不同的先验概率模型,两种算法的AU识别率和复杂度各有优势。除此之外,本文还从算法的实时性角度对两种算法进行了优化分析。