论文部分内容阅读
本文对包含以上问题的说话人识别的前端处理方面进行了相关研究,对目前使用最广泛的基于短时谱估计的几种方法进行了研究提出了一种权值随着帧数和频段变化的最优估计子;提出了一种新的特征提取框架;提出了一种评价各维贡献率的方法,并对不同的特征向量都作了实验,得到了各种特征向量各维的表征能力,介绍了基于主分量分析(PCA)的特征变换方法在高斯混合模型模型中的应用,介绍了处理录入设备和信道不匹配的特征补偿技术,并作了相关的实验来检验其功能,研究了模型的自适应技术,借鉴高斯混合模型-通用背景模型(GMM-UBM)方法中从通用背景模型自适应到说话人模型的自适应算法,对两个语音库进行了说话人自适应的实验研究;完成了一个可配置的说话人识别系统,可供进一步的学习研究之用。