基于混合高斯模型的说话人识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:A58400794
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究的是基于混合高斯模型下的与文本无关的说话人识别问题。本论文的目标是尽量提高说话人识别率,在这篇论文中,从前端特征处理,针对超短时说话人语音建模方法,高层信息在说话人识别中的应用等各个方面展开了研究,对传统方法做了一系列的改进,并且获得了实验的证明,主要集中在以下几个方面:说话人识别传统的在特征端进行去信道信息处理的特征映射方法是机械的使用语音的信道标注信息。在本文中提出通过利用半监督聚类方法,对数据的信道标注信息做修正,再进行特征映射。从实验结果看,改进后的特征映射方法可以使原来的传统特征映射方法对性能的改善由2%提升至6%。说话人识别在应用方向上的发展一直受到短时语音识别性能的影响,在短时语音中,传统混合高斯模型建模的方法由于受到数据量的限制表现的性能一直很差,在本文中利用本征音方法对短时语音进行建模,在实验中使得系统的等错误率相对与传统系统有18%的降低。最近几年,由于音素识别器技术的发展,高层信息在说话人识别中的应用成为了研究热点。本文中提出通过音素发音方式不同对音素进行分类,并在这之上利用并行音素级混合高斯模型来对语音进行建模。通过实验验证,基于并行音素级混合高斯模型的方法与作为基线系统的使用联合因子分析的混合高斯模型的方法相比,等错误率相对下降了17%以上,而最小检测代价也相对下降了10%左右。
其他文献
DS/FH混合扩频技术综合了DSSS和FHSS两种扩频方式的优点,具有更强的抗干扰、抗截获能力。本文基于平流层通信平台,对高动态环境下基于DS/FH混合扩频技术做了以下几个方面的研
随着VoIP技术的广泛应用,它的安全问题也日益突?目前,安全性能已成为评估VoIP系统性能的重要指标?本文首先从总体上分析了目前VoIP的安全问题,重点对传统的分层安全技术TLS协
CDMA2000基站收发信机(BTS)系统是一个结构复杂、功能强大的通信系统,分为硬件架构和软件系统两大部分。由于无线基站在地理分布上的广泛性和分散性,因此基站软件系统的稳定
本文将非线性最小二乘方向图综合法应用到MIMO雷达方向图综合中,首先对发射波形的协方差矩阵进行分解,然后构造非线性最小二乘代价函数优化分解因子,从而使综合的方向图最大
“同一认定”指的是物证技术领域中现存的一种有效方法,该方法通过对先后出现的客体留下的特征反映体进行检验,从而判定两者是否属于同一客体。据统计分析,出现两个人牙齿特
MIMO系统可以大大增加无线系统的容量,OFDM系统支持高速数据传输,而且很好地抑制了符号间干扰,两者的结合,使得MIMO-OFDM系统能够获得很高的频谱利用率。对于无线通信系统,无
无线局域网是上世纪末计算机网络和无线通信技术相结合的产物。它使用无线电波和信道为用户提供接入服务,为通信的移动化、个人化和多媒体应用提供了条件,并成为宽带无线接入
广播发射台的自动监控技术一直是广电技术工作者研究开发的一个重点和难点。现场总线控制系统代表了自动化监控系统的最新发展阶段。本文通过对比国内外几种重要的现场总线技
随着通信技术的发展,数字多媒体信息传播变得更为广泛和快捷。然而数字多媒体易于复制和修改。因此数字媒体的版权保护和认证成为迫切需要解决的问题。数字水印成为一种有效
随着信息科学与网络通信技术的快速发展,无线传感器网络给人们带来巨大而深刻的时代变革。迄今为止,无线传感器网络已被广泛应用在空气质量监测、工业污染、智能家居、国防科技