论文部分内容阅读
本文的研究工作主要有两个方面:1.针对短语音(训练语音少于8秒)的说话人识别系统,将模糊聚类分析的思想引入到模型的训练中,并在此基础上提出了四种基于模糊聚类的短语音说话人识别算法。2.针对高斯混合模型对初值敏感,容易陷入局部极小值而得不到最优解的问题,将具有全局优化特性的遗传算法引入到高斯混合模型的优化中,分析了基本遗传算法存在的问题,提出了两种高斯混合模型的优化方法,并应用到说话人识别中。论文的主要研究内容如下:(1)提出了基于遗传-模糊聚类分析的说话人识别算法,利用遗传算法的全局优化特性,改善了模糊聚类分析的说话人识别算法对初值敏感的问题,使算法在较短训练语音的说话人识别中体现了较强的优势。(2)研究基于核方法的短语音说话人识别。将核方法引入到说话人识别中,提出基于模糊核矢量量化的说话人识别算法,并在此基础上,引入熵的概念,提出了基于模糊核熵的说话人识别算法,进一步提高了短语音说话人识别系统的性能。(3)提出了基于可区分性模糊核矢量量化的短语音说话人识别算法,利用语音信号的不同部分在不同说话人之间的唯一区分特性,进一步增加了说话人之间的区分性,使算法在训练语音少于8秒时,得到较好的识别结果。(4)利用遗传算法及模糊聚类分析对高斯混合模型进行优化,研究了基于遗传-模糊高斯混合模型的说话人识别,改善了高斯混合模型初值敏感的问题,提高了系统的识别率。(5)针对遗传算法“早熟”和局部搜索能力较弱的问题,研究了基于自适应小生境遗传算法的说话人识别,进一步提高了算法的寻优能力,得到了更优的模型参数。