抗噪声说话人识别技术研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:asergh12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是生物识别技术的一种,目前常用的说话人识别系统对纯净语音的说话人识别率已经达到很高的水平,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因而鲁棒性是影响说话人识别系统能否实用的一个关键问题,本文的研究重点是说话人识别系统的鲁棒性能,提高噪声环境下的说话人识别率。抗噪声说话人识别的目的是尽量减小或者消除噪声所带来的训练模型和测试语音之间的失配,从而提高含噪语音的说话人识别率。消除噪声所带来的失配可以映射到信号空间、特征空间和模型空间。本文重点研究基于高斯混合模型的说话人识别系统中具有鲁棒性的特征参数提取、含噪语音的增强二个关键技术,也就是从这信号空间和特征空间来进行研究。主要工作如下:1)提出了一种改进的Mel频率倒谱系数,记为:PL MFCC,并成功的将PLPCC用于说话人识别;研究PL MFCC、PLPCC、MFCC、LPCC及其一阶差分的性能,并研究动静态组合特征参数的抗噪性能;2)研究各种参数和基音组成联合特征参数的鲁棒性能;研究基音和共振峰及PLPCC组合成的组合特征参数的鲁棒性能。3)信号空间采用谱减法、wiener滤波法来增强语音,提高信噪比。实验表明上述的方法能不同程度的提高噪声环境下的说话人识别率。
其他文献
稻田土壤有机碳固定对缓解大气CO2浓度的上升具有重要意义。我国稻田土壤有机碳在过去30年中呈上升趋势,其原因主要来自于施肥和产量提高导致的有机物质归还量的增加。但其中
喀斯特地区生态系统受人为干扰严重,导致喀斯特区生态环境不断恶化,区域的可持续发展受到严重威胁。土壤微生物可敏感地指示土壤环境条件的变化,是反映土壤质量的指标之一。本研
动态纹理是在空间上具有重复性,在时间上具有连续性,无限性并符合一定统计特性的图像序列。很多自然界的现象,如流淌的河水,随风摆动的麦浪,或者飘动的旗帜等等,都具有态纹理
基因组大小(Genome Size)是重要的生物学特征,植物核基因组的大小差异很大。影响基因组大小进化的因素中,一方面多倍化和转座子(尤其是LTR反转录转座子)的扩增使基因组急剧增大
学位
种子萌发时间决定着一株植物在何时进入生态系统,种子萌发又受到休眠和环境因子的调控,因而,种子休眠和萌发对于盐生环境的适应能力是决定盐生植物在盐渍生境中成功建群和繁衍的
学位
随着流媒体技术的迅速发展,特别是将嵌入式技术、流媒体技术以及Internet技术的结合,很多嵌入式流媒体系统将不再是一个个孤立的系统,系统的互联使得信息安全问题变得更加突
电源管理电路具有高集成度、高性价比、最简外围电路、最佳性能指标、能构成高效率电源等优点,具有广阔的市场前景。本文所设计的电路主要用于低电压的多媒体数字信号编解码器芯片的设计。一般应用包括PDA、MP3播放器、数码相机、无线电话与数据网络、仪器等。目前,电源管理集成电路市场大部分被国外产品占据,研究开发国内的电源管理电路产品具有特别重要的意义。本文设计了一种LDO(低压降)线性降压变换器,它有较宽的
NAC蛋白是植物特有的转录因子,广泛参与植物生长发育过程。本研究以杨树(Populustrichocarpa为研究对象,对NAC基因家族进行系统分析,共鉴定出163个NAC基因家族成员,进化分析显示这