论文部分内容阅读
随着数字多媒体技术和网络的普及,人们共享数字媒体信息越来越便捷,与此同时各种编辑篡改软件也随之兴起,因而保证数字媒体文件的真实性和完整性显得尤为重要。数字音频文件作为广泛使用的媒体文件之一,研究音频取证技术具有重要的安全意义。本文根据音频语义篡改的类型,对同源复制粘贴篡改提出三种检测算法,对异源拼接篡改提出一种检测算法。主要工作如下:1、分别研究了同源音频复制粘贴篡改和异源音频拼接篡改的典型检测算法,并对其进行仿真分析,指出算法存在的不足;2、针对同源复制粘贴篡改,提出了两种基于时域特征的篡改检测算法。第一种方法是基于内容匹配度的检测算法,选择合适的长度将音频分离出来的字节划分成片段,比较两两字节间各个音频小片段的相似性,若有两对片段大于设定的阈值,则判为复制篡改字节对。第二种方法是基于字节时域直方图特征快速检测算法,时间复杂度从同类算法O(n~2)下降到O(log)n。首先提取表征每个字节的直方图特征,对直方图均值快速排序后计算相邻均值内两字节的直方图特征的相关系数,当相关系数大于设定的阈值时,则判定两字节存在复制关系。实验表明这两种算法均有较好的检测性能。3、针对同源复制粘贴篡改,提出了一种基于频谱特征帧间相关性的篡改检测算法。先对待测音频采用过零率预判,再计算字节间两两帧间的幅度谱相似度,然后对所有字节对进行匹配,根据设定条件找出存在复制粘贴关系的字节对并确定篡改区域。实验表明该频谱特征优于其他变换域的特征,对加噪、重采样和压缩具有一定鲁棒性。4、针对异源音频拼接篡改,提出了一种基于设备本底噪声梅尔倒谱系数(Mel-Frequency Cepstrum Coefficients,MFCC)特征的检测方法。首先对待测音频利用小波变换(Wavelet Transform,WT)进行降噪,分别对待测音频和降噪信号求取MFCC系数,进而得到设备的本底噪声,并讨论该特征的稳定性。最后通过滑动窗口方式计算本底噪声特征帧间相关系数向量,利用相关系数向量及其一阶差分进行双重判断,来判定待测音频是否存在篡改并实现定位。实验表明,该算法对重采样和压缩具有一定鲁棒性。