基于听觉特性的语音增强算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:woshi8848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强已经成为语音数字信号处理的一个重要分支,也是语音数字信号系统能够进入实用化的一个重要环节。本文以目前应用最为广泛的谱减法为基础,引入听觉模型,利用人耳的三个听觉特性:绝对听阈、临界带宽和掩蔽效应来改进谱减法,达到语音增强的目的。 首先根据临界频带将频谱划分成多个互不重叠的频带,在每个频带内,根据人耳的听觉掩蔽效应和绝对听阈设计谱减法中的过减因子和谱平滑参数,使经过谱减残存在语音中的“音乐噪声”低于语音的掩蔽阈值或人耳的绝对听阈,最大限度地抑制噪声,并带来了最小程度的语音失真。 根据人发音的特点,语音信号中2KHz以上的高频信号功率谱比较小,根据掩蔽效应设计出的过减因子比较大,一定程度上破坏了语音的高频信息,而人耳对于高频,特别是2KHz~4KHz频带的信号较为敏感。所以本文利用谱平坦度能够估计出高频中语音含量的特性,重新调整高频每个临界频带的过减因子,减小语音含量高的频段内的过减因子,保护高频语音信息。实验证明,改进的基于听觉特性的谱减法在信噪比高的情况下,很好的保护了高频信息,减小了谱失真。
其他文献
21世纪,世界经济发展和资源环境的矛盾日益突出。燃料电池技术,特别是熔融碳酸盐燃料电池(MCFC)技术是一种高效环保的化石燃料利用技术,在MCFC当中加入直接内重整以后可以进一步提高系统的效率,降低系统的复杂程度和成本。近些年世界各地许多实验性DIR-MCFC电站的建立和运行证明了这种技术的有效性。但是成本,稳定性和寿命等问题仍然困扰着科学家,成为这种高效环保发电技术进一步向商业化发展的主要障碍。
优先发展教育,加快教育现代化,新时代互联网技术高速发展与高职教育又紧密结合,我国的体育教育事业发生了质的改变.移动互联网快速融入到人们工作学习中,超星学习通是面向教
新冠肺炎突如其来,给我们的生活、学习带来了诸多不便,学校的教学方式更是发生了前所未有的变化,大学体育也在“停学不停课”的号召下展开了线上教学,山西工商学院开展了大学
从目前的高职院校体育课程开展情况来看,大部分的课程活动体系还是存在一定的差距,不能适应社会发展对人才培养的需求,高职院校体育课程的改革也一直是教师研究的重点方向.围