改进RASTA-PLP语音特征参数提取算法研究

来源 :太原理工大学 | 被引量 : 11次 | 上传用户:xsw2233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于人耳对声音的接受能力很强,所以基于听觉特性的语音特征最能反映声音的本质,具有好的鲁棒性。因此,基于听觉特性的语音特征提取方法在语音识别领域中日益受到重视。本文首先在噪声环境下,对基于听觉特性的PLP(Perceptual Linear Predictive,感觉加权线性预测)特征参数和RASTA(RelAtive SpecTrA)-PLP特征参数的提取算法进行了研究。PLP特征参数在临界频带分析处理、等响度曲线预加重和强度响度转换上模拟了人耳的听觉特性,是全极点模型的一组系数。RASTA滤波器等效于一种IIR滤波器,它的高通部分可以抑制平稳的非语言学背景,低通部分则有助于平滑帧与帧之间的快速变化。将RASTA滤波技术应用于PLP特征参数的提取中,提高了参数的识别率,取得了好的实验结果。其次,本文使用半升正弦函数倒谱提升技术、差分技术、倒谱提升和差分的联合技术以及差分和倒谱均值减的联合技术来改进RASTA-PLP特征参数。半升正弦函数(Half Raised-Sine Function,HRSF)倒谱提升技术可以降低易受噪声干扰的低阶分量值,同时提高数值相对小的中高阶分量值。差分技术可以体现语音特征参数的动态特征。倒谱均值减(Ceptral Mean Subtraction,CMS)技术可以减少通道噪声。实验结果表明,改进后特征参数的识别结果优于原始特征参数的识别结果。最后,本文将语音增强中的谱减法和维纳滤波技术应用于改进后的RASTA-PLP特征参数中。特征参数在提取时,将语音短时功率谱经过谱减和维纳滤波来减少加性噪声,从而提高特征参数的鲁棒性。谱减法基本思想是在假定加性噪声和短时平稳的语音信号相互独立的条件下,从带噪语音的功率谱中减去噪声功率谱,从而得到较为纯净的语音。维纳滤波根据平稳随机信号的全部过去和当前的观察数据来估计信号的当前值,在最小均方误差的条件下得到系统的传递函数,是一种最优线性滤波方法。实验结果表明,改进后的参数具有较高的识别率。
其他文献
通信信号调制模式的自动识别是近年来信号处理领域研究的热门课题,是电子对抗的重要内容,也是信号分析的一个快速发展领域。通信信号调制模式识别广泛应用于信号确认、干扰识
随着FPGA技术的不断发展和应用,使得电子设计规模和集成度不断的提高,同时也带来了电子系统设计方法和设计思想的不断推陈出新。新一代的FPGA甚至集成了中央处理器(CPU)或者
20世纪90年代以来隐写与隐写分析成为信息安全领域的研究热点。隐写与隐写分析之间的关系,类似于密码学与密码分析学之间的关系,两者缺一不可,它们相互促进、共同发展。本文
随着现代电子、通信和计算机技术的飞速发展,军事应用领域的无线传感器网络逐渐进入到工业控制、医疗救护和环境监测等诸多领域,它把逻辑上的信息世界和真实的物理世界联系在一
图像处理已经成为计算机视觉领域的研究热点。本文涉及的基于光锥耦合的新型数字X射线成像系统,具有分辨率高,体积小,重量轻,携带方便等优点,能够满足小幅面的医学成像和无损
入侵检测技术是网络安全防御体系的关键技术之一,它通过收集网络和主机上的相关信息,根据制定的安全策略对信息进行分析和检测,并对检测到的入侵事件发出警报并进行防范处理
随着计算机图像技术的快速发展,布料仿真技术受到越来越多关注与研究。近年来,基于物理的仿真模型—质点-弹簧系统仿真模型由于其仿真效果逼真、简单易用、算法易于实现而得到
多输入多输出技术(MIMO,Multiple Input Multiple Output)是一种收发两端采用多天线传输的一种技术,相对于传统的单发单收系统来说,具有更高的系统容量等优良特性,因此成为未
近几十年来,随着射频微波技术的高速发展,人们对无线移动终端的小型化、高性能以及多功能化的要求越来越高。为了满足小型无线通信设备的高质量通信功能,其内置天线必须拥有小型
图像信息作为信息呈现的一种重要手段,一直以来是人们观测客观事实的重要信息来源。图像信息广泛应用于卫星遥感、机器视觉、生物医学、交通、公安、军事等诸多领域,这使得图