论文部分内容阅读
近年来在音频编码领域一种新兴的波形编码技术——谐波参数化编码技术正日益受到关注。该技术结合了心理声学的研究成果,建立了人类听觉的空间感知模型,并根据该模型提取经DFT变换得到的谐波参数,因此是一种参数编码技术,它代表了当前音频编码领域前沿的主流研究方向,由于它突破了传统波形编码的许多局限,在取得高质量的音响效果的同时,其码率非常低。由于它的这些优点,参数编码受到学术界的普遍关注。
理论上,本文旨在通过借鉴现有的一些波形参数化编码的STN模型,设计出一个结合参数编码和传统波形编码的混合编码器,针对信号的平稳特征,达到音质与编码效率的最好折中。由于现今的STN尚未标准化, 存在的算法各异,因此编解码器的软件实现作为本文具有研究比较的价值。本文采用的算法是先对信号进行分割,而根据信号的平稳特征来确定分析加窗的长度,以及是否采用谐波参数化编码来处理。对谐波的选择及量化的噪音控制也是摒弃了常规的“频域掩蔽门限”的概念,而是引用了客观音质评价标准ITU-R BS.1387中的人耳感知差异概率来的递归的算出每个谐波对人耳总体频域响应的贡献,作为谐波幅度,频率和相位的量化权重。同时为了进一步压缩谐波的参数,在连续的平稳帧与帧之间引进了相邻频带串连的机制,采取差分编码。
实践上,基于所提出的这种音频编解码方案设计出软件,并用音频工程师协会(Audio Engineering Society)提供的单声道标准测试码流进行编解码比较。在实践研究过程中,学习并掌握了传统音频编码里对音频信号分析,心理模型的运用,快速DFT变换以及Huffman编码等一系统关键技术。作为一个音频编码器的雏形,该课题具有良好的可扩展性,例如如何利用双声道甚至多声道间冗余来提高多声道的编码增义;帧与帧之间相连接的谐波的相位和频率运用更复杂的预测编码,而不是一阶的差分编码来提高编码增义。