非特定人鲁棒性语音识别中前端滤波器的研究

来源 :太原理工大学 | 被引量 : 6次 | 上传用户:lin901102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非特定人语音识别在于净环境下识别性能良好,但在噪声情况下,其系统性能将会大大下降。不仅如此,其识别率还受到语音多变性的影响,使识别的难度加大。本文针对非特定人识别系统中的噪音鲁棒性和多变性鲁棒性问题,对在特征提取时起重要作用的前端滤波器进行研究。分别从听觉感知和语音信号本身这两个角度出发来设计滤波器,使得滤波器更符合人耳听觉特性,或更精确地分析待识别的语音信号。抗噪实验表明,随着滤波器性能的不断提高,对应提取特征的噪音鲁棒性逐渐提高,不仅如此,多变性鲁棒性的实验表明,滤波器性能的提高与多变性鲁棒性的提高是一致的。本文主要完成了如下工作:(1)在FIR滤波器设计的基础上,给出Laguerre滤波器设计的详细步骤,并用后者代替前者用于过零峰值幅度(Zero Crossing Peak Amplitude, ZCPA)特征的提取。给出频域法实现Laguerre滤波器提取ZCPA特征的详细过程。Laguerre滤波器具有FIR滤波器的线性相位和ⅡR滤波器的长时记忆性,弥补了FIR滤波器通阻带特性差的缺点。实验表明,精确设计每一通道的中心频率和带宽得到的Laguerre滤波器较FIR滤波器明显提高了噪音鲁棒性。(2)针对FIR, Laguerre滤波器带宽呈对称性分布,不符合人耳听觉特性这一缺点,设计实现了弯折滤波器组(Warped Filter Banks, WFBs),并将其应用于ZCPA特征提取。通过一阶全通函数中的弯折因子p控制滤波器中心频率和带宽的分布,从而得到非均匀的频带分布和非对称性的带宽分布。典型的弯折因子p=0.48,p=0.63分别对应Bark, ERB尺度滤波器。同FIR, Laguerre滤波器相比,WFBs不需要严格控制每一通道的中心频率和带宽,而是同时得到16个通道的频率响应。实验表明,非均匀分布的频带和非对称分布的带宽较均匀分布的频带和对称分布的带宽明显提高了识别率;同FIR, Laguerre滤波器相比,尽管WFBs设计简单,但满足非对称性带宽分布的特性,因此ERB尺度的WFBs识别率更高,其噪音鲁棒性更好。(3)从待识别的语音信号本身出发,依据数字信号处理理论设计出优化滤波器组(Optimized Filter Bank, OFB)模型,并简化得到自适应带宽滤波器组(Adaptive Bands Filter Bank, ABFB)模型。FIR, Laguerre以及WFBs均是在人耳听觉感知准则上建立的滤波器模型,而OFB的设计则创新性地以识别性能为基准,首次通过遗传算法将前端滤波器和后端识别系统结合为一个整体,形成一个闭环系统进行优化。实现表明,OFB模型较Bark尺度滤波器明显提高了识别率,但由于其个数较多,不利于应用。因此简化OFB模型后得到ABFB模型,实验表明后者识别率仍明显高于Bark尺度滤波器,甚至优于ERB尺度滤波器。因此FIR, Laguerre, WFBs, ABFB四种滤波器中,ABFB滤波器的噪音鲁棒性最好,这也表明从分析语音信号本身出发对滤波器设计的重要性。(4)滤波器通道的个数,对滤波器分析信号的精度也有一定的影响。FIR,Laguerre, WFBs以及ABFB滤波器都是采用16通道的带通滤波器和16个频率箱提取ZCPA。使用Gammatone(GT)滤波器提取ZCPA时,采用K通道带通滤波器,并设计相应数目的频率箱接收幅度信息。实验表明,18通道较其他通道数的GT滤波器识别效果更好。(5)将FIR, GT, Laguerre,以及WFBs滤波器应用于多变性语料库的非特定人识别中,实验表明,随着滤波器性能的完善,其多变性鲁棒性也逐渐提高;且同MFCC特征相比,ZCPA在支持向量机(Support Vector Machine, SVM)系统下较在隐马尔可夫模型(Hidden Markov Model, HMM)下具有更好的多变性鲁棒性。
其他文献
阿兰·德波顿联手当代英伦思想家中的翘楚,追问人生的本质与意义,诚恳解答当下的问题:如何保持情绪的健康?如何找到理想的工作?如何不为金钱而焦虑?如何看待爱情与性爱的关系
已有关于材料相似性影响短时记忆的研究提示,不相似材料组块相比于相似材料组块可能促进记忆。为验证该假设,该研究采用学习-测查范式,通过4个实验考察了学习材料组块方式对
安徽界首市位于黄淮平原的中部,早秋蔬菜比较缺少。近年来,我市及周边地区早秋平菇栽培规模不断扩大,为了提高早秋平菇的高产、高效,我所对近年来主栽六个早秋平菇菌株进行了比较
【正】 在阿城县亚沟公社东五公里的石人山峭壁上,有一处金代女真族石刻图像,距今八百余年,这就是著名的亚沟石刻图像。现存两幅图像,为一男一女。左侧男像是武士装束,像高18
超快强激光技术的不断发展使其在高能物理、材料科学、非线性光学、惯性约束聚变等诸多方面显示出广阔的应用前景。目前,人们对超快激光的研究多集中在可见和红外波段,而在实
亚沟摩崖石刻是金源地域重要的文化遗存之一,1988年被国务院公布为全国重点文物保护单位。长期以来,学界多以石刻存在于金源故地,而视其为金代女真人的文化遗存。石刻存在的
自然和人类活动是导致饮用水中氟含量超标的主要原因,饮用氟含量超标的水会对人体造成伤害,必须采取经济有效的方法进行脱氟处理。传统的活性氧化铝和骨炭等吸附剂对于低浓度
在国家实施振兴东北老工业基地战略之际,在东北工业体系中占有重要位置的机电产业如何制定有效的专利战略参与国际国内竞争是一个紧迫的课题,研究的目的旨在通过探讨合理的专利
PVC改性后与丁腈胶并用,可不需要高温混炼。FVC改性体能显著降低胶料门尼粘度,改善工艺性能,并可提高硫化胶硬度,改善耐热老化性。并用胶料用于高硬度丁腈胶辊的生产,能很好
随着时代的进步和社会的发展,发达国家在技术具有明显的优势,从而削减了对中国商品的需求从美学角度讲,传统的严谨单调的艺术风格已不符合现代人的审美需求。目前,中国的当代