论文部分内容阅读
伴随着网络中信息的爆发增长,与其随之同时产生的还有渐渐增多的视频数据。对这些大量数据信息,若能够实现检索、浏览、存储时的高效,人们就能方便地获取到自己感兴趣的内容或数据的主要内容。而在视觉与触觉、听觉等信息当中,视觉信息是人类最能直观接收信息内容的方式。基于此,通过视觉中的显著性进行视频信息的摘要化技术应运而起。通过摘要化处理,可以得到精炼且包含内容主旨的视频信息。本文通过对运动场景视频的分析,结合视频显著性检测完成摘要生成,主要内容可概括为:(1)基于经典视觉注意力金字塔模型,提出改进的可变比例及双对比度计算的中心-环绕金字塔视觉模型。该方法以视频目标显著性检测为出发点,对由视频得到的连续图像序列进行检测。首先将所有视频帧在RGB颜色空间下计算RG、BY及亮度等通道颜色结果,并以超像素方式对图像进行像素块划分从而加速图像的计算,再通过改进的可变金字塔比例空间构建中心金字塔与环绕金字塔,同时通过两种对比度算法检测不同颜色背景下的明亮或深色物体得到图像对比度特征差异并进行融合。最后,结合光流运动信息提取结果,合并静态图像与动态图像显著性结果得到最终检测结果。该方法在遵循人类视觉处理机制的条件下,通过新的视觉注意模型,对图像中的显著前景物体进行了有效的提取,并融合连续图像序列所具有的运动特征,进一步提升显著区域的检测效果。(2)提出了基于多种图像特征提取及图像相似性计算的运动视频关键帧提取方法。该方法选取原始视频图像在HSV颜色模型下的转化并按比例量化、融合的颜色特征结果,以及图像纹理结果,并对先前得到的显著性结果进行效果增强,通过距离计算及感知哈希函数完成相邻图像之间的相似性判断。经过聚类筛选完成最终视频摘要化的生成。该方法可以有效地提取图像感兴趣区域,并最终得到以关键帧图像序列方式表示的、压缩精炼后的视频摘要。