论文部分内容阅读
音频信号的频带扩展技术是音频信号处理领域的研究热点。本文以非线性动力学理论为基础,利用非线性时间序列分析技术对音频信号展开研究。首先,分别利用互信息法和虚假近邻法计算延迟时间和嵌入维数,实现了音频信号时间序列的相空间重构。然后采用替代数据法检验了音频信号时间序列的非线性特性,根据递归图和定量递归分析技术验证了音频信号时间序列的确定性,并分析了音频信号时间序列的几何不变量。 为了提高音频信号分析的准确度,本文提出了基于递归图和定量递归分析的音频分类算法。算法从递归图的宏观模式和微观模式出发,研究了音频信号的递归特性。然后从定量角度提取了音频信号时间序列的递归特征参数,并利用基于决策树的层次化分类器将其分为四类:噪声型、暂态型、谐波型和混合型,为后续的音频频谱细节扩展算法奠定了基础。 针对音频信号的频带扩展,本文提出了基于非线性音频特征分类的频带扩展算法。算法首先利用高斯混合模型拟合音频信号高低频特征之间的联合概率密度,并在最小均方误差准则下估计高频频谱能量。然后分别采用频谱折叠1次,频谱折叠2次、非线性预测和频谱拉伸技术实现了四类音频信号的高频频谱细节恢复。最后利用基于软判决的码书映射算法调整了频谱的能量增益,输出超宽带音频信号。 在实际应用方面,本文将基于非线性音频特征分类的盲目式频带扩展算法应用到24kbps码率下的ITU-T G.722.1宽带音频编解码器中,并与同码率下ITU-T G.722.1C超宽带音频编解码器的性能进行比较。主客观质量测试表明,频带扩展后的G.722.1编解码器与同码率下的G.722.1C超宽带编解码器得到的音频质量相当。