论文部分内容阅读
本文在深入研究传统音频频带扩展技术的基础上,分析了超宽带音频信号的高低频相关性,首先,根据低频谱包络和感知音色特征,研究了高频子带能量的估计方法;其次,基于非线性动力学中的相空间重构和最近邻匹配的方法,研究了高频频谱细节的非线性预测方法,最后,在实际编码器上实现了由宽带到超宽带音频信号的盲目频带扩展。在高频子带能量估计方面,本文引入了高斯混合模型,并用其拟合高低频特征的联合概率密度,在最小均方误差准则的基础上构建了一套基于高斯混合模型的高频子带能量估计算法,保证了在平稳特征数据下高频子带能量估计的准确性。在此基础上,将隐马尔科夫模型引入到音频频带扩展算法中,并基于最小均方误差准则构建了一套基于隐马尔科夫模型的高频子带能量估计算法,进一步改善了重建音频的感知质量,有效地解决了扩展后高频子带能量的时域突变问题,提高了在复杂特征数据条件下重建音频频谱能量的平滑性。在频谱细节恢复方面,本文利用相空间重构技术验证了音频信号在频域内的非线性特征,并利用低频相轨迹的局部演变规律,提出了基于最近邻匹配的高频频谱细节非线性扩展方法。在实际编码器应用方面,本文组合隐马尔科夫模型和非线性预测技术,构建了一套完整的“盲目式”宽带向超宽带音频信号的非线性频带扩展算法,并将其应用到24kb/s速率下的G.722.1宽带音频编码器中,主观和客观质量评价表明,频带扩展后的G.722.1编码器质量与同码率下的G.722.1C超宽带编码器相当。