基于语音组成单位的文本无关说话人识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文就特征提取、文本无关说话人识别的主要经典方法作了回顾,强调并阐释了各种方法在物理上的意义。针对文本无关说话人识别中训练语音和测试语音的内容不受制约因而不具可比性的问题,本着“在具有可比性的语音组成单位中寻找不同的身份信息”的思想,系统地提出了一种说话人识别方法。该方法提取语音中的浊音作为训练样本和测试样本。以LPC系数作为特征向量,将语音的每一帧特征向量视作一个语音组成单位。用一个高斯概率密度函数表征一个语音组成单位,以此为每个人建立语音组成单位的模型,也就是每个人语音组成单位的集合。获得模型各参数的方法是:对说话者的训练样本用k均值聚类算法进行初始聚类,得到每一个类的类心和协方差矩阵的初始值。然后利用GMM迭代算法对类心和协方差矩阵进行优化处理。把优化后的结果作为语音组成单位在特征空间中的表示,从而得到各语音组成单位在特征空间中的分布。以这个模型为基础,设计说话人识别算法。通过处理测试样本对模型中语音组成单位的匹配值,分别提出了一种对说话人进行确认和辨认的方法。两种方法的物理意义明确、可操作性强。实验结果表明,即使使用短时测试语音,上述方法也能取得较好的识别效果。最后,对全文进行总结,并对文本无关说话人识别的研究方向进行讨论。
其他文献
贝叶斯学习理论使用概率表示各种形式的知识和不确定性,并通过概率规则来实现学习和推理过程,是处理不确定信息的有力工具。本文在学习贝叶斯学习理论的基本观点和研究它的背
本文分析了燃气-蒸汽联合循环(GTCC)技术当前在国内外的发展现状,以及GTCC的主要特点和各部件的特性和结构特点。然后将整个联合循环系统划分成燃气轮机装置、余热锅炉和蒸汽
随着人类太空探索活动的不断深入,空间机器人在轨服务技术在保障卫星和空间站可靠、高效运行方面发挥着越来越重要的作用。而轨迹跟踪控制作为保证空间机器人完成复杂在轨服
发电机控制器作为飞机电源系统的一个重要组成部分,它通过对电压、电流、频率进行测量和监测,实现对电源系统的各种保护及控制功能,准确并实时显示飞机电源系统的工作状态。它能
身份识别和人们生活密切相关,随着网络的发展,电子商务的广泛应用,人们迫切需要一种简单高效且安全性高的自动身份识别系统。掌纹识别和指纹识别有某些相似性,都是以手为研究对象
磨削力和表面粗糙度分别是表征磨削加工过程和磨削加工质量的重要物理量。由于国外技术保密,目前尚无有关螺旋锥齿轮磨削力和表面粗糙度在线测量的资料公开发表,螺旋锥齿轮异常