论文部分内容阅读
语音增强已经成为语音数字信号处理的一个重要分支,也是语音数字信号系统能够进入实用化的一个重要环节。本文以目前应用最为广泛的谱减法为基础,引入听觉模型,利用人耳的三个听觉特性:绝对听阈、临界带宽和掩蔽效应来改进谱减法,达到语音增强的目的。
首先根据临界频带将频谱划分成多个互不重叠的频带,在每个频带内,根据人耳的听觉掩蔽效应和绝对听阈设计谱减法中的过减因子和谱平滑参数,使经过谱减残存在语音中的“音乐噪声”低于语音的掩蔽阈值或人耳的绝对听阈,最大限度地抑制噪声,并带来了最小程度的语音失真。
根据人发音的特点,语音信号中2KHz以上的高频信号功率谱比较小,根据掩蔽效应设计出的过减因子比较大,一定程度上破坏了语音的高频信息,而人耳对于高频,特别是2KHz~4KHz频带的信号较为敏感。所以本文利用谱平坦度能够估计出高频中语音含量的特性,重新调整高频每个临界频带的过减因子,减小语音含量高的频段内的过减因子,保护高频语音信息。实验证明,改进的基于听觉特性的谱减法在信噪比高的情况下,很好的保护了高频信息,减小了谱失真。