说话人识别算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ningyuanhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别作为生物识别认证技术中的一种,是指利用语音信号包含的信息进行特征提取,来辨别或确认说话人.随着互联网和信息技术的快速发展,说话人识别技术逐渐成为研究的一个热点内容.在众多的说话人识别方法中,本文重点研究了传统MFCC特征参数的改进方法并结合高斯混合模型的说话人识别系统,主要研究内容如下:1.系统介绍传统说话人语音识别系统的特征提取方法和模型建立技术,特征提取方法重点介绍了MFCC特征提取和LPCC特征提取;模型建立列举了动态时间规整、隐马尔科夫模型、高斯混合模型和人工神经网络.2.在传统MFCC特征参数算法的基础上,提出了加入端点检测算法,将采集语音中的静音段去除,通过缩短语音时长降低传统方法计算量大的弱点;并在此基础上,将三角滤波器组更换为高斯滤波器组,从而更有效地获到相邻子带之间的平滑过渡,提高识别的准确率.3.在使用高斯滤波器组改进传统MFCC算法的基础上,进一步提出利用基音频率动态改变高斯滤波器组中的控制方差,这一改变是通过引入新的线性映射方程,将每一帧语音信号中包含有说话人发音独特性的基音频率以线性映射的方式来动态改变高斯滤波器组的控制方差,构造出能够更好地代表不同说话人声带振动周期性特点的动态MFCC特征参数.实验结果表明,改进算法在识别率上有了很大提升,在说话人识别中具有很大的实用价值.4.本文统一选用高斯混合模型作为上下文无关的说话人识别模型,优点是能够利用多个高斯分布拟合不同说话人的特征向量分布空间,是说话人识别系统中最常使用的识别模型.经实验验证,本文改进的两种方法都能够在传统方法基础上提高识别率,具重要研究意义.
其他文献
截至2013年9月,中国创业板市场已推出4年之久。该市场作为中国资本市场的重要组成部分,其发展进程与中国经济发展息息相关。但是与主板市场相比,创业板市场的投资风险较大,许多在
近年来,关于形状参数对曲线曲面的调控研究非常广泛,其主要思想是在不改变控制顶点的情况下,改变形状参数的取值,进而实现曲线曲面的整体或局部调控,可以调整曲线(曲面)与控制多边形
本文主要研究一类带有多重非线性临界项的拟线性椭圆方程组.本文总共有五章.首先,在第一章引言部分中,我们介绍了本文将要研究的方程组及与其相关的一些研究背景,与其同时引
本文主要研究图的几类特殊符号控制,在点控制问题上,着重对符号全控制及其概念性质进行深入地思考,引入了反符号全控制概念;在边控制问题上,主要对图的符号边控制,减k边控制
本文通过对比分析《华尔街日报》、《金融时报》和《纽约时报》三家外媒中文网对十八届三中全会的报道,发现其中文网在进行涉华政治报道的过程中不同程度地运用了本土化策略,
实际工程系统中,种种原因会造成系统结构的突变、系统参数的不确定、以及时间滞后和扰动等等。滑模控制在这些系统中的成功应用具有十分重要的意义。  论文主要探讨了三类