宽带音频的非线性频带展宽技术

来源 :北京工业大学 | 被引量 : 7次 | 上传用户:xixiyibobo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在深入研究传统音频频带扩展技术的基础上,分析了超宽带音频信号的高低频相关性,首先,根据低频谱包络和感知音色特征,研究了高频子带能量的估计方法;其次,基于非线性动力学中的相空间重构和最近邻匹配的方法,研究了高频频谱细节的非线性预测方法,最后,在实际编码器上实现了由宽带到超宽带音频信号的盲目频带扩展。在高频子带能量估计方面,本文引入了高斯混合模型,并用其拟合高低频特征的联合概率密度,在最小均方误差准则的基础上构建了一套基于高斯混合模型的高频子带能量估计算法,保证了在平稳特征数据下高频子带能量估计的准确性。在此基础上,将隐马尔科夫模型引入到音频频带扩展算法中,并基于最小均方误差准则构建了一套基于隐马尔科夫模型的高频子带能量估计算法,进一步改善了重建音频的感知质量,有效地解决了扩展后高频子带能量的时域突变问题,提高了在复杂特征数据条件下重建音频频谱能量的平滑性。在频谱细节恢复方面,本文利用相空间重构技术验证了音频信号在频域内的非线性特征,并利用低频相轨迹的局部演变规律,提出了基于最近邻匹配的高频频谱细节非线性扩展方法。在实际编码器应用方面,本文组合隐马尔科夫模型和非线性预测技术,构建了一套完整的“盲目式”宽带向超宽带音频信号的非线性频带扩展算法,并将其应用到24kb/s速率下的G.722.1宽带音频编码器中,主观和客观质量评价表明,频带扩展后的G.722.1编码器质量与同码率下的G.722.1C超宽带编码器相当。
其他文献
随着国内新型冠状病毒肺炎(COVID-19)疫情防控形势的好转,全国各地医院的眼科诊疗工作已逐步恢复,为在疫情防控基础上科学有序恢复眼科手术工作,最大程度降低围手术期院内感
目的 全面总结评估艾尔巴韦/格拉瑞韦的临床价值、经济价值、病人价值、社会价值,为临床合理用药,减轻患者疾病负担提供参考.方法 检索PubMed、Embase、中国期刊全文数据库、