语音识别中神经网络声学模型的说话人自适应研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yu351464325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络(Deep Neural Network,DNN)技术在自动语音识别(Auto Speech Recognition,ASR)中取得了重大的突破,相比于传统的高斯混合模型(Gaussian Mixture Model,GMM)显著地提升了系统的识别性能。然而,像其他监督学习方法一样,DNN容易受到由于训练和测试条件不匹配导致的性能下降的影响,说话人自适应(Speaker Adaptation,SA)是为了解决说话人差异导致的不匹配问题,在基于神经网络的声学模型上研究说话人自适应技术成为语音识别领域的一个热门方向。本文分别从特征和模型的角度对说话人自适应方法进行研究,对这些自适应方法进行融合和改进,并深入探究基于卷积神经网络的说话人自适应方法,论文的主要研究工作如下:首先,针对声学模型中DNN对说话人信息辨别能力差的情况,引入基于辅助特征的说话人自适应方法,将包含说话人信息的特征与声学特征拼接共同作为DNN的输入,增强网络对说话人信息的感知能力。实验结果表明,基于辅助特征的说话人自适应方法有助于提升网络的区分能力,减小说话人之间的差异性,进而降低系统的单词错误率。接着,深入研究基于学习性隐层单元分布(Learning Hidden Unit Contributions,LHUC)的模型域自适应方法,并分别采取两种策略对原方法进行改进。从自适应方法之间的互补性角度出发,本文提出LHUC与辅助特征相融合的方法进一步提升系统的识别性能。此外,为了解决自适应阶段的数据稀疏问题,多任务学习(Multi-taskLearning,MTL)引入到LHUC自适应中,它通过加入额外的音素分类任务作为辅助任务帮助自适应参数更新。实验结果表明,基于融合的自适应方法能够有效地提升模型对特定说话人的匹配程度,进一步降低系统的单词错误率:基于MTL-LHUC的自适应方法通过扩大声学空间的覆盖范围弥补了稀少的状态分类问题,在有限的自适应数据条件下取得了更出色的性能提升。最后,本文对卷积神经网络(Convolutional Neural Network,CNN)框架的说话人自适应方法展开研究。为了利用LHUC这种具有诸多优良特性的模型域自适应方法,本文尝试对该方法进行改进使之适用于CNN的声学模型中,分别通过对比实验比较自适应层置于卷积层、池化层以及输入层的性能差异并证实该方法的有效性。同时,本文还提出一种基于i-vector的卷积层自适应结构,该方法通过一个变换矩阵将i-vector插入卷积层,新的卷积层结构在提取局部信息的同时也能够减小说话人之间的差异性。相关的实验结果表明该方法相比于基线系统有效地降低了单词错误率,并且仅增加了少量的参数作为代价。此外,将以上两种方法进行融合对系统性能有更进一步的提升,在无监督自适应模式下取得了最优的实验结果。
其他文献
随着我国科学技术的不断进步,智能化产品如雨后春笋般涌现,智能化已经成为社会发展的方向,电力行业也不除外。智能电网的出现,势必会刮起智能狂潮,发展走向将在不同程度上影
近年来,旅游业作为现代服务业的重要组成部分得到了快速发展,在这一背景下,也对风景园林建设产生了巨大的影响。本文从概括我国旅游业发展整体状况入手,通过分析旅游业发展与
水泥厂余热发电计算机监测系统设计中几个问题探讨邹伟联河北省唐山市冀东水泥厂(063037)为了解决我厂扩建第二条4000t/d干法水泥生产线的用电需要,缓解当地供电紧张状况,我厂在一、二条水泥生
语音识别是一种易于令人接受的生物认证识别技术,近几年发展迅速,被广泛应用于安保、声纹指令、语音锁、司法鉴定、身份认证、语音听写,语音合成,汉语命令识别等领域,其中,汉
本文总结了鸡新城疫病的检疫方法,常用的检疫方法有病毒分离培养、血凝试验(HA)、血凝抑制(HI)试验、荧光抗体检测和PCR等,由于病毒表面有血凝素,对鸡红细胞有凝集作用,通过
LFEF(立窑)玻纤袋除尘器与看火操作程志源,杨俊清安徽省东关水泥厂(238151)解立勋合肥威达净化除尘设备公司1引言水泥生产各工序过程都会产生粉尘排放,各扬尘点粉尘排放浓度与生产管理水平、工
随着科学技术的发展,说话人识别在深度学习背景下不断有新突破和新进展。目前占主导地位的是以身份认证矢量I-vector为基础的说话人识别系统。本文重点研究了如何改进传统特
用回归分析控制煤矸石代粘土煅烧水泥的配热量陈天石广西罗城矿务局水泥厂(546402)在利用煤矸石代粘土煅烧水泥过程中,常因煤矸石本身热值波动造成窑的热工制度不稳定,从而影响熟料质量
应用外加剂技术对粉煤灰水泥性能进行了改性,试验结果表明,由激发剂、石灰、表面活性剂和早强剂组成的复合外加剂能有效地克服粉煤灰水泥早期强度低、耐久性差、碳化速度偏大以