论文部分内容阅读
为了节省信道容量和存储空间,人们通常利用人耳对音频信号高频信息的敏感性弱于低频信息的特点将高频信息直接截去,这必然导致音频质量的下降。因此,需要引入频带扩展技术来重建被截去的高频信息,进而提升音频质量。音频频带扩展技术是音频信号处理的一项关键技术,其通过扩展音频信号的有效带宽来提升音频质量,它包括盲目式和非盲目式两类方法。本文对两类频带扩展技术中的现有方法进行了研究与对比,并结合盲目式频带扩展方法的优势,提出了两种有效的从宽带(0~7kHz)到超宽带(0~14kHz)的盲目式频带扩展方法。
首先,本文基于八度音阶的谐和性原理及人耳的听觉特性提出了一种基于重构八度音的盲目式频带扩展方法,主要涉及音频信号的时间过程及其频谱特性、音频信号中音阶与八度音的概念,并从高频细节谱的重建、高频谱包络的重建和共振峰的估计三个方面来阐述基于重构八度音的频带扩展原理。主、客观结果评测均表明:在绝大多数情况下,此方法比已有的其它盲目式频带扩展方法更加有效。
其次,本文从产生音频信号的非线性动力系统出发,在对低频谱信息相空间重构的基础上,利用Lyapunov指数对音频频谱信息进行混沌分析,构建了高频谱信息的非线性预测模型,并根据人耳的听觉特性与高、低频相关性,调整高频谱信息的谐波成分,提出了一套基于非线性动力学理论的盲目式频带扩展方法。主、客观结果评测均表明:在绝大多数情况下,此方法比已有的其它盲目式频带扩展方法更加有效,而且比基于重构八度音的频带扩展方法性能更高。
最后,本文对实验室提出的嵌入式语音频编码器的码率转换进行了研究,结合ITU-T的指标要求,在单声道模式下将码率转换分类,着重解决不同码率模块间的转换,并引入频带扩展技术来改善音频听觉质量。主观测试结果表明:此方案达到了ITU-T对码率转换的指标要求。