基于特征补偿的自动语音识别的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yongqingf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究的是自动语音识别中的前端噪声鲁棒性问题。众所周知,语音识别的根本目的就是使机器能够听懂人类的语言。在当前的实验室环境下,很多识别系统已经能够达到很好的性能。但在实际环境中,由于噪声的复杂多变和未知因素的干扰,系统性能往往会急剧下降以至于远远不能达到实用的目的。因此,噪声鲁棒性一直是语音识别研究中一个非常重要的方面。噪声鲁棒性的根源就在于训练环境和测试环境的失配。实际中这种失配是由语音采集环境的影响(如加性噪声、信道畸变等)以及说话人自身的影响(如说话风格、口音等)引起的,当然,我们也可以将这种失配都看成是噪声的影响。为了使语音识别系统在不同噪声环境下仍能具有较好的性能,就需要采用各种方法来增强识别系统的鲁棒性。噪声鲁棒性的方法多种多样,但一般来说可分为前端方法和后端方法两大类。前端方法集中于对语音信号本身或者语音特征做处理,达到消除或尽可能抑制噪声影响的效果;后端方法主要集中于增强语音声学模型自身的宽容度和适应能力,使模型能够容忍一定程度的噪声,或者调整模型参数使之跟上噪声环境的变化。本文主要是对噪声鲁棒性的前端方法进行了一些研究,改善了一些已有的方法,也提出了一些新的方法。首先,在本文第一章中,对语音识别技术的发展历程做了简单的概述,并重点介绍了一下基于统计建模框架下自动语音识别系统的几个重要组成部分。由于实际中噪声的多样化,使得噪声鲁棒性也出现了很多种方法,每种方法都有它的特点和适用范围。正是针对这种情况,论文在第二章中分别从鲁棒性特征的提取、语音增强、特征补偿/增强、模型补偿四个方面对噪声鲁棒性问题进行了比较全面的介绍和总结。在本文第三章中,首先介绍了基于显式模型的一阶矢量泰勒级数(VTS)离线特征补偿算法,但是离线算法在实用时并不完美,它最大的缺陷在于其巨大的运算量极大的降低了系统处理的效率。因此,在离线算法的基础上我们提出了实用化的一阶VTS特征补偿算法,它在保证离线算法性能的同时,大大提升了算法处理的实时性。虽然实用化的一阶VTS特征补偿算法取得了不错的效果,但是它和离线算法一样,对噪声均采用的是单高斯建模,而在实际环境中噪声是复杂多样的,这种情况下单高斯可能不能很好的描述噪声参数的分布特性,从而使干净语音估计不准最终影响到识别性能,针对以上问题,在本文第四章中,提出了对噪声多高斯建模的一阶VTS特征补偿算法。实验结果表明,噪声多高斯建模方法还是能够在一定程度上提高系统识别的性能。
其他文献
Ad Hoc网络作为一种新兴的无线网络,已经被广泛地应用于军事、民用以及商用等各个领域。但是,Ad Hoc网络固有的特征使其面临比传统网络更为严峻的安全问题。安全问题成为Ad H
视频图像是移动机器人感知环境的重要手段,其传输方法和性能影响到机器人操作人员的工作质量。与普通视频传输不同,移动机器人视频传输面临无线传输带宽的约束,尤其是低带宽
随着科技的飞速发展,计算机技术和无线通信技术也越来越成熟。无线网络开始越来越广泛的应用在人们的日常生活中。与传统的有线网络相比,因为没有了网线的限制,无线网络更加
21世纪是一个信息时代,随着科学技术的飞速发展,以无线传输方式传递信息已成为时代的主题。频率可重构天线通过加载一个或者多个可控器件改变天线的结构,使天线的工作频率在
准确的地震子波估计技术对于高分辨率、高信噪比、高保真度的地震勘探数据处理具有极为重要的意义。新兴的非线性优化方法进一步增强了统计性地震子波提取技术的应用潜力。针
网络中任何资源都有可能发生故障,为了提供一个高可靠性的网络,MPLS故障恢复机制能在网络故障发生后,快速进行修复。随着实时业务在网络中的大量应用,MPLS故障恢复机制已成为
工业零件的缺陷检测和尺寸测量是生产自动化和智能化的重要步骤之一。而目前大多数已实现的测量系统都只是简单的对某一类规则零件进行尺寸测量,并无集成多种零件类型的尺寸
油气管道防腐对于延长管道使用寿命及保障能源运输至关重要,阴极保护法是公认的防止金属电化学腐蚀最有效的方法。恒电位仪作为阴极保护电源,被广泛应用于埋地金属管道的防腐
人们在进行信息的交流、处理、传输和保存时,往往通过声音、图像以及文字和视频,其中图像是最能直接表达和接受的视觉信息。但是,在图像的接受、传输和保存的过程中,经常会受
人体行为识别在智能视频监控、客户类型、购物行为分析等现实生活中有着广泛的应用需求,然而由于杂乱的背景、遮挡和视点变化等因素的影响,准确的识别、分析现实场景中人体的