论文部分内容阅读
语音信号由于经常受到环境噪声的干扰和污染,对通信过程会产生一定影响,因此对含噪语音信号进行去噪处理,以改善语音质量,提高语音信号的清晰度和可懂度,增强语音处理系统的性能已变得很有必要。传统语音增强算法主要是基于语音的时域和频域特性,分别在时域、频域对其进行处理。本文主要对基于分数傅立叶变换的语音增强算法进行了研究,对语音信号在分数阶域进行增强处理。分数阶域的语音增强包括谱减模型选取、最佳变换阶次确定、端点检测和噪声谱估计等内容。首先研究了分数阶域的最优滤波算子原理和传统谱减算法,在此基础上选取多组不同变换阶次下的分数阶域功率谱特性作为估计对象,实现特定阶次下对原纯净语音功率谱估计。在分数阶谱减过程中,利用改进的自适应参数调节方法实现对噪声谱的有效估计,从而达到谱减目的。仿真结果表明,在关于变换阶次的局部区间内存在着某最佳变换阶次,其增减效果明显优于传统谱减法。其次在特定变换阶次基础上,将功率谱估计推广至整个分数阶域,对语音和噪声的分数阶功率谱特性进行Gauss分布统计分析,并进一步修改传统谱减模型;同时以均方误差为准则,在其最小情况下确定最佳变换阶次,实施该变换阶次下的分数傅立叶变换,提取功率谱幅值特性进行噪声估计处理,最后插入相位系数,实现语音和噪声在分数阶域上的最佳分离。对谱减过程中涉及到的噪声估计,本文提出了一种分数阶域的噪声谱估计算法,在分数阶域通过对语音帧和噪声帧的准确判断达到对噪声功率谱的有效估计。噪声帧判别通过分数阶域的端点检测实现,该算法在分数傅立叶变换高分辨率计算基础上,通过调节变焦因子,实时显示帧信号的分数阶域局部谱特征,计算帧信号功率谱中的峰值-副峰比,与判决门限进行比较,从而灵活确定语音帧和噪声帧。检测出噪声帧后,对噪声功率谱进行迭代估计处理。仿真结果表明,最佳变换阶次下的分数阶谱减能有效抑制背景噪声,提高语音性能。最后,鉴于噪声估计的经验性模态假设,虽然在自相关基础上提高了检测效率,但不够稳定。当噪声谱统计值大于当前语音帧的谱幅值时,所得功率谱估计值将会丢失较多原始语音信息,并伴有音乐噪声的产生,影响听觉效果。本文在神经网络算法的基础上,利用最佳逼近准则进一步对分数阶域的功率谱估计加以改进,提出了一种基于神经网络的分数阶谱减系数最佳逼近算法,对含噪语音功率谱进行最佳逼近,达到去噪目的。该方法在噪声谱估计基础上,能进一步抑制音乐噪声的产生,具有较好的增强效果。