论文部分内容阅读
随着多媒体技术和网络技术的飞速发展和广泛应用,数字多媒体产品的存储、处理和传输变得越来越方便和快捷,多媒体知识产权的保护问题显得越来越重要。然而,因为多媒体数据量大,具有不同的压缩标准和文件格式,经常经历各种保持内容质量的常规信号处理操作(如JPEG压缩等);而传统的加密与认证技术(如MD5和SHA-1等)只能进行比特流的认证,无法考虑到多媒体的内容,对任何比特哪怕是一位比特的改变都很敏感,因而在多媒体认证方面将显得无能为力。多媒体数字签名技术为多媒体进行内容保护提供了一种有效的解决手段。多媒体数字签名(Digital signature),又称为多媒体鲁棒哈希签名(Robust hash),它是指一个多媒体对象的感知特征(Perceptual features)或简短的摘要(Short summaries)。它的提取(生成)过程与传统密码学哈希函数类似:根据人类视觉系统(HVS)或人类听觉系统(HAS)的反应,将任意大小的多媒体对象映射到很短的位串,使得看或听起来相似的对象生成相似的签名,不同的对象生成不同的签名。所以,我们称该过程为多媒体哈希函数。多媒体数字签名技术可应用于多媒体认证与鉴别、内容索引与分析、数字水印、大规模媒体库管理、以及拷贝检测等。这是一个新兴的研究方向,其广阔的应用前景已经开始吸引了众多的研究者投入到这一行列。论文对多媒体数字签名中的一些重要问题展开研究,探讨了多媒体数字签名的模型与特性、通用框架、应用与方法,深入研究了图像数字签名的安全性、鲁棒性和篡改敏感性等问题。主要在以下五个方面取得了一些成果:一、鉴于目前还没有一个完整的多媒体数字签名模型,为了更清楚地描述这一问题,论文首先提出了一个多媒体数字签名模型,全面地描述了一个多媒体数字签名系统所应该具有的特性和达到的目标。然后,论文提出了一个多媒体数字签名的通用框架,该框架可应用于数字图像、视频、音频,以及文档等。在此基础上,论文提出了一种基于主成分分析(PCA)的多媒体数字签名方法。该方法不依赖于提取的低层特征,因而是一种通用的方法。该方法利用PCA在能量集中意义方面最为有效,以及基矢量(特征向量)依赖于数据、不同数据产生的基矢量不同这两个性质,取PCA变换后的基矢量为多媒体数字签名,在签名匹配时用基矢量的夹角余弦值来度量签名的相似性。二、通过对图像分块DCT系数矩阵进行主成分分析,以量化后的特征向量作为图像签名,提出了一种新的数字图像签名生成与匹配、以及篡改定位方法。大规模实验结果表明,所产生的签名对JPEG压缩和噪声具有很好的鲁棒性,同时具有很好的区别性和篡改检测能力,并能大致定位篡改区域。由于直接基于DCT系数生成签名,这种方法可直接扩展应用到MPEG视频认证。该方法生成的签名长度很短,且与图像大小无关,便于今后将数字签名作为水印嵌入到图像本身中,以解决传统数字签名认证技