基于神经网络的音频频带扩展算法研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:ZCHHZCHH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在深入研究传统的盲目式和非盲目式音频频带扩展方法的基础上,基于非线性动力学理论和神经网络模型,实现了一套完整的宽带(0~7kHz)音频到超宽带(0~14kHz)音频的盲目式频带扩展算法,并进一步将该技术应用到实际编码器中。首先,在确定音频信号的非线性特征的基础上,本文分别采用RBF神经网络和BP神经网络对相空间重构后的频域序列进行细节谱预测。结合音频信号细节谱预测时的实际情况,引入了模糊理论优化RBF神经网络,以提高其泛化效果。此外,采用修正学习率和附加动量项等方法提高其训练速度,以适应线上预测细节谱的需求。其次,在高频子带能量估计方面,本文采用RBF神经网络拟合低频的特征参数与高频子带能量间的映射关系,实现对高频能量的准确恢复。利用超宽带音频现下训练RBF神经网络并实时估计高频子带能量,结合非线性预测得到的细节谱,构建了一套完整的宽带音频向超宽带音频扩展的盲目式频带扩展算法。最后,在实际编码器应用方面,本文将基于神经网络的音频频带扩展技术应用到ITU-T G.722.1宽带音频编解码器中,并与ITU-T G.722.1C超宽带音频编解码器得到的超宽带音频进行对比。主客观测试均表明,24kbps码率时G.722.1与所提频带扩展算法相结合得到的超宽带音频质量,与同码率下的G.722.1C编解码器得到的超宽带音频质量相当。
其他文献
中子探测在粒子探测技术中占有特殊的地位,它不仅在粒子物理和核物理,而且在医学物理、天文物理、考古和地质勘探等学科都有广泛的应用,促进了中子探测器的快速发展。基于3He气
本文通过对荣华二采区10
期刊