论文部分内容阅读
随着互联网和多媒体技术的飞速发展,视频流媒体数据呈现出爆炸式增长的趋势,这就对视频流媒体的处理与传输提出了新的挑战。一方面,人们对多媒体资源的需求越来越多,并且对接收端视频质量的要求也越来越高,这就要求提供与流媒体资源相匹配的数据存储和传输能力;另一方面,受计算机的处理能力、异构网络环境、网络带宽、终端处理能力等方面的限制,人们只能将有限的计算资源分配给重要的视觉信息进行分析和处理。在广播数字化、网络无线化、通信宽带化和存储高密化的大趋势下,为了有效解决网络带宽、视频质量和用户实时性访问之间的矛盾,在提高流媒体播出质量的同时降低通信成本,需要同时考虑高效视频编码、异构网络传输和解码端的差错恢复能力等。为了准确评估视频播出质量,给以改善人眼视觉感受为目的的视频处理、传输系统提供判定依据,还需要对视频质量进行客观评价。本论文正是基于上述分析,在采用H.264/SVC视频预编码的前提下,重点研究传输过程中如何提高视频播出质量的关键技术。在基于人眼视觉感知特性的内容分析基础上展开研究,所涉及的关键技术包括:视频动态特性描述、视觉显著区域提取、数据包调度策略研究、码流渐进式传输表示、网络拥塞控制机制以及视频质量评价。本论文的具体研究内容和创新点可概括如下:1.提出一种反映人眼视觉特性的视频动态性描述方法。结合人眼视觉感知特性和眼动数据分析,引入运动强度、运动复杂度和运动密度三个特征量,通过前、背景运动矢量强度的加权和来描述对应帧的动态性,得到的客观运动强度值能够准确反映人眼对于画面的视觉感知关注度。2.提出一种符合人眼视觉特性的显著区域提取方法。该方法在空域通过频率域变换利用对数谱分析得到空域显著图,在时域根据视频动态性描述和视觉注意模型得到时域显著图,再通过动态调整权重,对时、空域显著图进行加权融合,最终提取出与人眼视觉感知相吻合的显著区域。3.提出一种基于视频动态性的数据包调度策略。在编码结构分析和率失真模型的基础上,结合视频动态性描述,同时考虑主客观因素对视频播出质量的影响。首先对数据包进行重要性分析并根据重要度由高到低对待传输码流进行排序,然后在带宽和时延的约束条件下,对进入发送端缓冲队列的数据包进行调度,优先传输重要性等级较高的数据包,从而改善视频播出质量。4.提出一种针对视频数据传输的网络拥塞控制机制。该算法在广泛应用的主动队列管理算法ARED的基础上进行改进,修改了缓存区平均队列长度、最大丢弃概率和丢弃率的计算方法,在拥塞发生时时根据数据包重要度,优先丢弃重要性等级较低的数据包,不但有效提升了网络性能,还改善了人眼对视频播出质量的主观感受。5.提出一种客观视频质量评价指标。该评价方法以结构相似性指数SSIM为基础,利用显著度加权求得每帧图像的质量评价值,再根据视频动态性描述求得逐帧质量评价值的加权和。利用公共数据集和对本论文上述关键技术的测试,证明该评价指标能够更好的反映人眼视觉感知,与主观评测结果更加吻合。综上所述,本论文以改善接收端的视频播出质量为目的,以视频动态性描述为研究基础,专门针对视频数据流在传输中涉及的关键技术展开研究,大量实验数据结果分析表明,本论文所研究的视频流媒体播出质量服务关键技术能够明显改善人眼对于视频播出的主观感知。