抗噪声说话人识别技术研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:asergh12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是生物识别技术的一种,目前常用的说话人识别系统对纯净语音的说话人识别率已经达到很高的水平,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因而鲁棒性是影响说话人识别系统能否实用的一个关键问题,本文的研究重点是说话人识别系统的鲁棒性能,提高噪声环境下的说话人识别率。抗噪声说话人识别的目的是尽量减小或者消除噪声所带来的训练模型和测试语音之间的失配,从而提高含噪语音的说话人识别率。消除噪声所带来的失配可以映射到信号空间、特征空间和模型空间。本文重点研究基于高斯混合模型的说话人识别系统中具有鲁棒性的特征参数提取、含噪语音的增强二个关键技术,也就是从这信号空间和特征空间来进行研究。主要工作如下:1)提出了一种改进的Mel频率倒谱系数,记为:PL MFCC,并成功的将PLPCC用于说话人识别;研究PL MFCC、PLPCC、MFCC、LPCC及其一阶差分的性能,并研究动静态组合特征参数的抗噪性能;2)研究各种参数和基音组成联合特征参数的鲁棒性能;研究基音和共振峰及PLPCC组合成的组合特征参数的鲁棒性能。3)信号空间采用谱减法、wiener滤波法来增强语音,提高信噪比。实验表明上述的方法能不同程度的提高噪声环境下的说话人识别率。
其他文献
动态纹理是在空间上具有重复性,在时间上具有连续性,无限性并符合一定统计特性的图像序列。很多自然界的现象,如流淌的河水,随风摆动的麦浪,或者飘动的旗帜等等,都具有态纹理
随着流媒体技术的迅速发展,特别是将嵌入式技术、流媒体技术以及Internet技术的结合,很多嵌入式流媒体系统将不再是一个个孤立的系统,系统的互联使得信息安全问题变得更加突
电源管理电路具有高集成度、高性价比、最简外围电路、最佳性能指标、能构成高效率电源等优点,具有广阔的市场前景。本文所设计的电路主要用于低电压的多媒体数字信号编解码器芯片的设计。一般应用包括PDA、MP3播放器、数码相机、无线电话与数据网络、仪器等。目前,电源管理集成电路市场大部分被国外产品占据,研究开发国内的电源管理电路产品具有特别重要的意义。本文设计了一种LDO(低压降)线性降压变换器,它有较宽的