基于改进高斯混合模型的说话人识别方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:huangli_java
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种利用语音信号来验证说话人身份的技术,与人脸识别,指纹识别,同属于生物特征识别的范畴。说话人识别可广泛的应用于金融,通信,安全等领域。   高斯混合模型是目前主流的说话人识别技术,目前高斯混合模型的参数估计方法主要是基于极大似然估计的EM算法。EM算法简单稳定,但对初始值较敏感,而且EM算法中无法实现自适应的参数选择,即采用EM算法的高斯混合模型的高斯密度函数的个数是给定的,必须依赖于先验专业知识进行选择,带有一定的主观性。   对于第一个问题,本文将蒙特卡罗过程中的吉布斯抽样算法引入高斯混合模型中的参数估计当中,避免了EM算法中的初始值敏感问题,同时使参数的收敛更快,从而提高了说话人识别系统的性能。   对于第二个问题,本文提出了一种无限高斯混合模型。理论上高斯混合模型是由无限个高斯密度函数组成的,高斯密度函数是否能够显现取决于是否存在由其产生的观测值。推导过程本身使用狄力克雷过程构造无限混合模型,通过蒙特卡罗过程中吉布斯抽样的方法来估计模型参数。实验证明,无限高斯混合模型能够有效的提高说话人识别系统的辨识率。   噪声和干扰一直是影响识别率提高的原因,大多数研究工作集中在模型的前端处理,在说话人识别后端处理方面研究不多。本文提出了一种新的非线性变换方法——归一化变换,该方法对帧似然概率进行变换从而得到帧得分,将前N帧得分进行平均,作为当前帧得分的权值。实验表明,归一化指数变换能够提高识别率,也就是说对说话人识别系统的后端进行处理也能够提高系统性能。
其他文献
集合卡尔曼滤波(EnKF)在传统卡尔曼滤波(KF)中演变而来,对反演水文地质参数来讲具有十分重要的应用价值.集合卡尔曼滤波的应用通常适用于预报以及分析等作用,在水文地质学中
目的研究Sulforaphane(SFN)对细胞凋亡的抑制作用及其在脓毒症中对细胞的保护作用。方法将HeLa细胞分为4组:对照组、热灭活大肠杆菌(Escherichia coli,E.coli)处理组、SFN处理组(SFN组)和热灭活E.coli +SFN组。酶联免疫反应检测炎症因子白细胞介素(interleukin,IL)-1β和肿瘤坏死因子(tumor necrosis factor,TNF)