基于SlicedWasserstein距离的GMM-UBM说话人识别的研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:linjing912977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种重要的生物识别技术,对于金融预防欺诈、移动支付、公安中的刑侦鉴识等领域有重要的应用价值。GMM-UBM模型(高斯混合模型-全局背景模型)作为在说话人识别技术研究中最为经典的模型,一直是相关领域研究的重点。在GMM-UBM模型中,UBM是一个涵盖了更多语音特征的高阶的高斯混合模型,因此在GMM-UBM模型中,高斯混合模型的参数估计是极其重要的。其中,期望最大化(EM)算法是高斯混合模型中最常用的参数估计方法。但是EM算法只能保证使似然函数收敛到一个局部极值点,从随机起点开始,EM算法有较大的可能收敛到一个较差的局部极值点。K-Means算法虽然能缓解这一问题,但效果有限。因而EM算法不能训练得到一个较好的GMM-UBM模型,进而影响识别精度。为了克服EM算法本身的局限性,本文提出通过优化sliced Wasserstein距离来估计GMM-UBM的参数。因为由sliced Wasserstein距离形成的优化空间包含较少的局部极值,使用随机梯度下降法优化sliced Wasserstein距离,会更容易得到较好的GMM-UBM模型,进而提高模型的说话人识别的识别率。本文提出使用最小化sliced Wasserstein距离的方法训练GMM-UBM说话人识别模型,并且与传统的使用EM算法训练的GMM-UBM说话人识别模型进行了对比实验,比较分析两种方法对于说话人识别系统识别性能的影响。实验结果显示,在不同初始化方法情况下,不同高斯混合数以及不同注册数据量的情况下,本文提出的方法的识别率都有不同程度且明显的提升。平均来说,与EM算法训练得到的最好的GMM-UBM模型相比,提出的方法在识别率指标上能提高5%左右。
其他文献
<正>Bloom综合征是一种罕见的常染色体隐性遗传综合征,笔者诊治1例,现报告如下。1病历摘要患儿男,10岁。因面部反复红斑7年余就诊。患儿3岁时无明显诱因两侧面颊出现对称分布
教师工作满意度是指教师对其所从事的工作、职业以及工作条件与状况的总体感受与看法。由于高校教师肩负培养高级人才的重大使命,提升其工作满意度是高校提高教师工作积极性
<正>随着《涉密信息系统集成资质管理办法》和《涉密信息系统集成资质保密标准》的出台,涉密信息系统集成资质和国家秘密载体印制资质审查工作已全面开展。在审查工作中发现,
鉴于PC结构在住宅产业化中得到了广泛应用,而众多学者的研究主要应用试验方法去分析PC结构的节点的受力性能、破坏机理及抗震性能,但可靠的构造方案是PC结构在住宅产业化中广
兴趣是一个人对认识和掌握某种事物,并积极参与某种活动,而且带有积极心理情绪的特质,它可以孕育动力,催生向往,在学习过程中发挥着重要的主导作用。在低年级学生学习数学的
目的探讨预见性护理对胃癌术后颈内静脉置管常见并发症的影响。方法将100例胃癌患者随机分为观察组和对照组各50例,对照组采用传统的护理方法,观察组进行预见性护理。比较2组
综合运用亲景度和市场竞争态模型,对福建1998—2007年间国际旅游客源市场进行深入分析,揭示福建国际旅游客源市场亲景度和竞争态时空演替特征.并在探讨亲景度和市场竞争态相
“四有”课堂教学模式以新课程理念为指导,改革课堂教学模式,变“讲堂”为“学堂”,在课堂教学中充分体现“四有”,落实全新的教育目标观、教育观、评价观、学生观。使课堂成为学
1临床资料 患者女,2岁,斟面部起疹1年,于2012年4月10H就诊。 1年前患者面颊出现2个淡红斑,小片状,约拇指盖大小,似对称,边界不清,未曾消退并逐渐扩大,现为对称性似蝴蝶状红斑,上有毛细