基于听觉特性及语谱特性的语音增强

来源 :苏州大学 | 被引量 : 0次 | 上传用户:baobaolan1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强技术在实际应用中有重要价值。目前,语音增强已在语音处理系统、通信和多媒体技术等领域得到了越来越广泛的应用。本文以语音增强为研究课题,提出基于人耳听觉特性和语音语谱特性的语音增强方法。主要以谱减法为基础,结合人耳的听觉特性从而减少残留“音乐噪声”的影响;结合语音的语谱在时-频域分布特性从而提高增强后语音的听觉质量。根据人的发音特点,通过分析语音的语谱在时-频域的分布,发现把听觉掩蔽效应应用于语音增强时存在不足之处。人耳对2kHz~4kHz频段的语音非常敏感,但是此频段语音的功率谱本身比较小,因而设计出的减参数将比较大。这样得到的减参数在很大程度上破坏了2kHz~4kHz频段语音信息。本文依据语音语谱的时-频域分布特性,提出利用后验Bark信噪比来估计出敏感频段的语音含量,重新设计2kHz~4kHz频段减参数,尽量保护敏感频段的语音信息。实验结果表明,在输入信噪比较高的情况下,本文的方法相对基于听觉掩蔽效应的谱减法,可以在其基础之上有效地提高各种输出信噪比。同时,在语音的主观质量评价中,本文的方法改善了语音的质量。因此,本文提出的语音增强方法在抑制“音乐噪声”的同时,增强了听觉效果。
其他文献
近年来,随着移动通信技术的高速发展,尤其是第三代移动通信技术的广泛应用,手机天线的性能不断迎来新的机遇和挑战,正朝着小型化、多频化、宽频化、智能化的方向迈进。而微带天线
无线通信的迅速发展,给数据网及通信带来了根本性的变革,也使网络整合成为必然。并且随着轻巧的便携式电脑的普及,人们对于无线网中实现实时多媒体传输运用的要求也越来越强烈,其
本课题是国家863项目—××应用系统信息传输分系统的一部份,该信息传输分系统构建了超短波分层自组织网络。Ad hoc网络是一种由节点自组织组成的无线网络,每个节点都具有路
自从9.11恐怖事件之后,隐写术与隐写分析作为信息安全的新领域,正逐渐成为人们研究的重点。隐写术主要研究如何将消息隐藏于各种形式的载体之中,目的是防止攻击者怀疑并检测