基于多窗谱的单通道耳语音增强的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:bjiyguang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音是人们在公共场合常使用的一种交流方式。由于发耳语音时的呼吸噪声、背景噪声以及环境噪声,进行耳语音处理时对含噪耳语音的去噪及增强就显得极为重要。   目前,耳语音方面的研究很少,很多都是对耳语音的基本特性的分析,在耳语音增强方面就更少,大多都采用基于短时幅度谱估计的算法进行耳语音增强,其残留的背景噪声和音乐噪声较大,会给听觉质量带来影响。因此本文从噪声和先验信噪比估计,增益(加权规则)和耳语音的感知特性等方面对耳语音增强进行了研究,主要研究内容如下:   针对基于Fourier变换的周期图法的谱估计偏差和方差较大,导致残留音乐噪声的问题,本文利用小波阈值多窗谱功率谱估计法方差小的特点,对噪声以及含噪耳语音与噪声之比进行估计,实现先验信噪比的平滑,进而采用端点检测对噪声进行跟踪,使得估计的噪声谱更接近真实谱。最后利用改进的功率谱减法得到增强耳语音。实验结果表明,该算法使得降噪后的耳语音有较小的语音失真,且有效地抑制了音乐噪声。   基于最小均方误差准则推导了Wiener滤波的参数形式,并结合耳语音声级低,信噪比低的特性,进一步提出了改进的参数Wiener滤波法。   基于最小量控制递归平均算法,从含噪语音的多窗谱估计噪声和先验信噪比,并根据多窗谱方差小的特点对估计算法的参数作了调整。最终的增强耳语音通过改进先验信噪比估计增强算法获得。主客观评价指标表明:高斯白噪声下,多窗谱和改进先验信噪比估计的结合能使增强耳语音的质量得到较大的改善,几乎不存在音乐噪声。   由于人耳对耳语音具有特殊的处理方式,本文采用了听觉掩蔽模型与符合耳语音感知特性的WSS(whispered sensitive scale)相结合的处理方法进行耳语音增强。首先根据耳语音的WSS感知特性,对传统的临界频带划分进行修正,以适应人耳的敏感频段从耳语音的第一共振峰移到第二共振峰的特点,然后基于修正的临界频带计算听觉掩蔽阈值,对不同的听觉掩蔽阈值动态地调节谱减系数来进行耳语音增强。其中,用于计算掩蔽阈值的预增强耳语音是用基于多窗谱的改进功率谱减实现的,因此掩蔽偏移量也根据多窗谱方差小的特点做了调整。实验结果表明与其他谱减方法相比,该方法在提高信噪比、抑制背景噪声、减少语音失真等方面得到了改进。
其他文献
网络演算是一种用于计算机网络服务质量保证分析的理论。自从诞生于上世纪九十年代初,网络演算理论引起了越来越多研究者的关注和兴趣。通过引入最小加代数,网络演算理论可以将
智能交通系统(Intelligent Transportation System,ITS)是当今交通运输领域的研究和应用热点。ITS融合图像处理、计算机技术、人工智能等多学科先进技术,在信息处理方面优势
水稻杂草对水稻生长带来极大危害,它是长期适应水稻耕种、气候、土壤等生态环境而生存下来的,具有很强的适应能力。杂草与水稻争夺养分、水分及光照等,易于助长病虫害的滋生
随着互联网应用与工业4.0的蓬勃发展,建立一个高度灵活的自动化和数字化的产品与服务的生产模式,对制造行业来说,不仅是生产力的提高,更是竞争力的增加。对印刷企业来说,设备生产
新兴十大技术之一的无线传感器网络是新一代的传感器网络,是集传感器技术、微机电技术、现代网络与无线通信于一体的综合智能信息处理平台,可广泛应用于公共安全、生态环保、
随着计算机及通信技术的发展,信息安全越来越受到人们的重视。密码学是信息安全的基础,是现代信息网络得以生存和不断发展的基本前提。在密码学中,密钥安全是一个很关键的问
无线医疗是医疗领域和无线通信领域的一个崭新研究热点。将无线技术应用于医疗服务可以满足医疗服务中越来越多的个性化需求,高效准确的采集和组织医疗数据,降低医疗时间成本
随着行车里程的不断增加,路面养护工作日趋繁重。常规路面病害的数据采集、检测一直采用基于人工视觉的现场调查方法,该方法存在劳动强度大、耗时、低效、结果速度慢、解释周
人们对自由通信的渴望促进了无线通信网络的迅速发展。随着无线通信技术的快速发展,目前存在的主要矛盾就是当前的通信网络结构与通信技术越来越难以满足日益增长的用户数以
MIMO-OFDM和MIMO-SCFDE是宽带无线通信系统中物理层传输的主要支撑技术,将MIMO和分块传输技术结合既可以通过MIMO技术提高数据传输速率又可以通过分块传输技术使得系统均衡简