基于i-vector特征的说话人自适应算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ustcer08005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过几十年的研究,语音识别技术取得显著进步,在无噪声、朗读发音等特定条件下已经走向实用。然而,在面临低数据资源、噪声干扰、说话人方言口音差异和复杂信道等情况时,识别率会迅速下降,还不能满足应用要求。本文结合上述问题,主要针对说话人发音特征,研究基于深度神经网络语音识别声学模型的说话人自适应方法。论文的创新点和研究成果总结如下:  第一,改进了可适用于说话人自适应的i-vector特征提取方法。针对说话人发音差异问题,本文首先使用语音识别声学模型来生成通用背景模型,然后基于该鉴别式分类算法改进i-vector特征提取方法。与说话人识别技术中的标准算法相比,改进后的算法能更充分的挖掘说话人的信息,更加适用于语音识别说话人自适应。与此同时,为了支持搭建在线语音识别系统,本文还研究了在线的i-vector特征提取方法。  第二,将i-vector特征说话人自适应方法和fMLLR说话人自适应方法相结合,构建并实现了包括DNN声学建模和LSTM声学建模的两套说话人自适应语音识别系统。深度神经网络在语音识别领域取得了巨大的成功,因此本文详细研究了DNN和LSTM递归神经网络声学建模方法,并将基于fMLLR的DNN建模自适应系统作为基线系统。以此为基础,再结合改进的i-vector特征提出了融合两种自适应算法的建模方法。由于两种自适应算法具有一定的互补性,融合后的方法提升了语音识别系统对说话人信息进行建模的能力。  本文在越南语标准数据集上进行了细致的实验验证。实验结果表明,该说话人自适应方法在性能上表现出色,尤其是LSTM说话人自适应系统字节错误率相对基线系统降低11%,该系统与实验室在NIST OpenKWS15评测中取得公开条件第一名时的LSTM系统相比仍有性能提升。这充分体现了本文研究的有效性和前沿性,具有实用价值。
其他文献
寡毛类纤毛虫是海洋调查中最常见的浮游微生物类群之一,在微食物网系统能量传递和物质循环中起着重要的作用。由于传统形态分类学对研究者经验的高度依赖性,该类群的生物多样性
红外焦平面读出电路需要工作在深低温条件下,代工厂商提供的常温SPICE模型不能有效地进行深低温电路的模拟,特别是温度在50K以下,完全不能反映出电路的低温特征,深低温模型参数的
随着光纤通信数据传输业务的逐年成倍增长,不断对光纤网络特别是局域网和城域网的传输速度和容量提出了更高的要求。目前,对应于石英光纤零色散和低损耗窗口的1.3-1.55μm近红
学位
从企业环境战略的转型内容和转型路径两方面论述企业环境战略转型的内涵,厘清员工层面、组织层面和领导者层面的环境战略内容变化以及不同类型环境战略之间的转型路径,并在此
摘要:在高效课堂的背景下,作为语文学习听、说、读、写四大板块之一的读不应该被省略,反而更应该加强。所以,教师要通过多种形式创设朗读的情境,引导学生开展多种形式的读,在读中感悟,在读中领会文章内容。本文就简要谈谈在语文课堂教学中指导学生读的策略,旨在与同仁分享。  关键词:语文课堂;读;教学策略  中图分类号:G633.33 文献标识码:A 文章编号:1992-7711(2016)05-0070  
随着纳米技术的产业化和纳米材料的广泛应用,纳米氧化锌(ZnO)因其特有的理化性质,在电子、陶瓷、涂料和化妆品等领域得到了广泛的应用,并通过空气、水、食物链等途径进入生物体
学位
异质结双极晶体管(HBT)是重要的高速电子器件,在微波/毫米波功率器件和单片集成电路(MMIC)方面具有重要的应用前景。双异质结HBT(DHBT)具有开启电压低、反向击穿电压高、输出
学位
高温炎热是气候过渡区冷季型草坪草夏季生长的主要胁迫因子,冷季型草坪草耐寒不耐热,如何提高冷季型草坪草的耐热性至关重要。采用不同的处理方式来提高草坪草的耐热性是本文要
传统的气象监测要素包括气压、气温、风速、风向、湿度等。而气压是其中重要的参数之一,因此高精度大量程的气象压力传感器的研究对气象业务的发展具有重大意义。在各类传感器
学位