基于超定随机霍夫变换与Chirp谱分析的语音谐波检测及其在语音增强中的应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:jydliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强是语音信号处理领域中一个重要的研究方向,相关技术可以应用在说话人识别、语音识别以及数字助听器等众多系统中,对提高系统的鲁棒性起着重要的作用。在前人的研究中,一些经典方法被先后提出,其中的谐波增强法则充分利用了语音中谐波结构所具有的抗噪声特性,因此在强噪声干扰情况下性能显著。 本文工作主要围绕谐波增强方法中的关键部分谐波检测问题展开,设计并实现了超定随机霍夫变换算法及其相关的聚类算法,且将其与Chirp谱分析技术相结合引入到谐波结构检测技术中。主要解决了如下问题: 首先,超定随机霍夫变换用于谐波检测摒除了传统方法中高频谐波结构因能量较低而无法对谐波提取的精确性提供足够信息的缺点,综合考虑了各次谐波在语谱图上的能量(幅值)分布特性以及高低频谐波之间的关系,可以在噪声干扰下提取出更加准确的基频。克服了当前算法中由于基频估计不够准确而带来的谐波结构偏差较大问题以及谐波提取算法对噪声敏感的问题。 其次,超定随机霍夫变换的谐波检测方法为Chirp谱分析提供了调频率线索,同时Chirp谱分析的结果又使得谐波检测更为准确。二者迭代进行,最终收敛。使得Chirp谱分析的调频率的确定更加准确。 最后,在检测出谐波结构的基础上,基于听觉研究中的侧抑制机理,对频谱中的非谐波成分予以衰减,以达到谐波增强进而抗噪声的目的。 实验表明,本文所设计并实现的超定随机霍夫变换算法及其相应聚类算法在谐波提取中有良好的效果。在多种噪声情况下,相对于基线系统信噪比平均有1.57dB的提高;SIR平均有5.18dB的提高。
其他文献
限于键盘的面积,常用的拼音和五笔汉字输入在嵌入式系统受到很大影响,手写体输入是解决这个困难最好的方法之一。但嵌入式系统的硬件资源有限,因此手写体汉字识别应考虑到嵌
基于麦克风阵列的说话人定位技术是近年来新兴的一个研究方向。目前还存在着许多问题,其中关键的难题是如何在噪声和混响同时存在的环境下进行说话人定位。  本文以基于到
随着导航技术的发展和民用市场的不断应用,手机导航系统在无线应用领域的发展非常迅速。目前普通的手机定位技术和手机导航系统还存在诸多亟待解决的问题:单纯的GPS定位或者手
学位
书家杨化友无论工作如何忙碌辛苦,却总是怀着淡泊明志、修身养性的态度,广泛结交各地书画家,虚心学习请教,并抽出时间精力对历代书法名家的碑帖研究临习,笔耕不止,使自己的书
由于实际物理条件的限制,通常观测到的图像都存在着各种不同程度的退化模糊。为了有效识别目标,必须先对模糊图像进行预处理以恢复出清晰的图像。图像复原的目的就是从观测到的
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文通过对通用串行总线通信协议和直接数字频率合成技术的研究和分析,设计实现了一种基于直接数字频率合成的高精度频率源,该频率源采用通用串行接口与计算机相连,能在计算机软
作为第三代同步辐射光源,上海光源对束流轨道稳定性提出了很高的要求,完备而精确的束流位置测量系统是保证束流稳定性的基础。经过详细调研,上海光源采用一种新型的数字化束流位
脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)是一种有着生物学背景的新一代人工神经网络,和传统的人工神经网络(Artificial Neural Network,ANN)模型相比有着很大的
本论文研究的主要目的是尝试设计一高性能的控制平台以适应多电机控制的需求,同时也为验证控制算法及进一步提高电流环采样频率提供实验平台。   本文以无刷直流电机(BLDC)