论文部分内容阅读
寻求新型有效的压缩方法始终是数字媒体领域的关键问题之一。基于内容的压缩代表着新一代的压缩方法,也是本课题所提出的冗余内容压缩方法的来源。传统的数据压缩算法中,通常没有针对数字媒体内容进行结构性分析,而是直接对信号进行压缩,造成了压缩结果中仍存在大量内容上的重复。与前者相比,基于内容的压缩具有明显的研究价值。它通过对原始信号生成层次化结构,发现并降低多媒体内容上的冗余,最终能大大改进压缩效果。 本文所研究的基于音频的冗余内容压缩正是这样一种新型的压缩方法,通过对音频信息的抽取,实现更高层的压缩。这种思想去除了重复出现的内容片段,使算法对信息的压缩效果比传统方法更为明显。 课题的研究工作主要包括了音频分割,音频单元的内容描述和对音频内容的压缩实现三个部分。第一部分是音频内容的逻辑表现层抽取过程,对已经过前端处理的信号进行内容层次上的音频分割——采用基于LPC(Linear Prediction Coding)距离的分割方法,生成了音频单元的集合,在这部分中经实验验证得到了较为准确的分割结果;第二部分通过对LPC系数加权统计算法,得出各分割单元的内容描述,这种内容描述能准确表示出相应音频段的信息;第三部分对生成的内容描述进行比较、合并和更新等过程,应用压缩算法决策是否保留相应的音频段,最后生成内容层次上无冗余的压缩结果。除了各部分算法中的验证性实验外,文章的最后设计并实现了两种主要实验来论述压缩效果,即无损压缩的验证实验和冗余检测的完整性验证实验。通过实验和分析,最终得出了本文算法对基于音频的冗余内容检测的完整性和压缩过程的完全可逆性这一结论。