基于声学特征的语种识别建模关键技术及实用化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：ssz1000

【摘要】

：

本文围绕目前前沿的基于声学特征的语种识别技术建模和实用化过程中系统性能存在的不足和挑战，从建模方法层面进行了深入的研究，主要创新性研究成果如下:　　(1)提出了三种结合

【作者】

：

徐嘉明

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

语种识别极限学习机声学特征支持矢量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文围绕目前前沿的基于声学特征的语种识别技术建模和实用化过程中系统性能存在的不足和挑战，从建模方法层面进行了深入的研究，主要创新性研究成果如下:　　(1)提出了三种结合极限学习机的语种识别建模算法。正则化最小类内方差极限学习机综合利用了数据的整体分布情况和类边界数据的分布情况;流形正则化极限学习机则充分挖掘了数据在特征空间中的非线性分布情况;流形正则化最小类内方差极限学习机可以在理论上将上述两种算法进行统一。这三种算法均可以处理更加复杂的数据分布情况，在GMM超矢量(GMM Super-Vector，GSV)特征空间中，较之传统的支持矢量机(Support Vector Machine，SVM)建模算法可有效地提升系统性能。　　(2)提出了一种结合深度极限学习机的身份认证矢量(identity vector，i-vector)建模算法。该算法可以从多角度充分挖掘i-vector特征中包含的分类信息。基于该算法的系统性能明显优于传统的基于线性鉴别式分析(LinearDiscriminant Analysis，LDA)后接余弦距离打分（Cosine Distance Scoring，CDS）分类算法的系统性能，同时该算法对易混语种和短语音语种识别性能也有大幅度的提升。　　(3)提出了一种基于迁移学习的语种识别建模算法。本文针对实际应用中存在的只有少量与测试集匹配的训练数据的情况，采用迁移学习的思想，利用大量的与测试集不匹配的训练数据辅助进行训练。提出了基于核方法的迁移学习算法以及基于极限学习机和深度极限学习机的迁移学习算法。实验表明，上述各个算法均可明显提升系统的识别性能。　　(4)提出了一种基于分差准则的训练数据标注错误检测和数据筛选方法。本文针对训练数据中存在标注错误的情况，提出利用分差准则对训练数据进行筛选。该方法是一种通用的方法，不依赖于具体的建模分类算法。研究表明，较之传统的数据筛选方法，该方法可以更加准确的对训练数据中标注错误的数据进行检测，从而有效地提升语种识别系统的性能。　　有关工作表明，本文所提算法可有效地提升现有语种识别系统的性能并在一定程度上解决语种识别实用化中存在的问题。最后，本文将提出的改进系统与基线系统及并行音素识别器后接向量空间模型(Parallel Phone Recognizer followedby Vector Space Model，PPRVSM)系统进行融合，融合系统在NIST LRE2009年评测30秒、10秒和3秒测试条件下的Cavg分别达到0.78％、1.93％和9.45％，通过与国际报道的最好结果相对比，本文融合系统的性能可以和国际一流语种识别水平相比拟。

其他文献

人类与非人灵长类大脑DNA甲基化模式的比较及初步功能分析

表观遗传修饰的调控作用日益受到人们的重视。然而，我们对进化过程中表观遗传修饰如何影响表型仍然知之甚少，尤其是表观遗传分歧在人脑进化中扮演何种角色正逐渐成为一个关乎神

学位

人脑非人灵长类大脑脱氧核糖核酸甲基化差异性表观遗传学

TBK1s和TRIM30α负性调控天然免疫反应机制的研究

本研究主要分析TBK1的剪接体TBK1s和TRIM30α，分别通过影响病毒介导的Ⅰ型干扰素途径和Toll样受体途径的信号转导，负性调节天然免疫反应的分子机制。天然免疫反应是机体防

学位

TBK1sTRIM30α负性调控天然免疫反应机制

长江江豚乳腺发育与乳汁分泌规律研究

哺乳是哺乳动物所独有的重要生命过程，也是其最重要的进化特征之一。通过哺乳，母兽不仅可以为幼兽提供充足的能量和丰富的营养，同时乳汁中含有的特殊活性因子对幼兽免疫力、促进

学位

长江江豚乳腺发育乳汁分泌规律

功率型LEDs透明电极研究

LEDs器件发展对电极的制备提出了更高的要求，得到低欧姆接触电阻率、高光学透过率、可靠性稳定性良好的电极是电极制作的目标。本文包括以下几项工作： (1)介绍了白光照明

学位

ITOp-GaN欧姆接触表面处理白光照明磁控溅射LEDs透明电极

南亚热带人工林恢复过程中土壤微生物群落结构的动态研究

土壤微生物是土壤生态系统中的重要组成部分，在养分循环和凋落物分解过程中发挥着重要作用。土壤微生物的生物量和群落组成受到很多因素的影响，其中生态系统的类型和林龄的变化

学位

热带人工林土壤微生物群落结构生物量碳

发光二极管红光对乙醇/新生霉素抑制C2C12细胞康复作用

光生物调节作用(photobiomodulation，PBM)是单色光或激光对生物系统的非损伤调节作用。PBM具有内稳态调节性质，有细胞康复作用。PBM可调节由药物等致病因子引起的细胞内稳态破

学位

骨骼肌C2C12细胞功能抑制发光二极管红光光照剂量康复作用

基于ARM的小波图像压缩技术的研究

随着通信技术和网络技术的发展，数字图像压缩技术的不断进步，数字图像传输成为信息表达的主流。良好的图像压缩技术不仅要能够实现高压缩率和高保真度，而且还应该满足渐进式传输

学位

图像压缩图像压缩小波零树编码小波零树编码提升算法提升算法压缩效果压缩效果

光通信用可调谐半导体激光器的研制

可调谐激光器是WDM系统及未来全光网络中关键器件之一,在现在及未来都具有广泛的应用前景,除了在光纤通信中有大量应用外,还广泛地应用于光传感和光测量.国际上对半导体激光

学位

半导体可调谐激光器取样布拉格光纤光栅分布反馈分布布拉格反射

基于网络虚拟化和移动边缘计算的软件定义工业互联网关键技术研究

学位

新型掺稀土光纤的研制

本论文以新型掺稀土光纤为研究对象,着重制作和研究了高功率光纤放大器的Er共掺双包层石英光纤、百瓦激光器用双包层掺Yb光纤,开展了以下工作并取得若干创新性的成果:利用MCV

学位

光纤激光器光纤激光器光纤放大器光纤放大器双包层掺稀土光纤双包层掺稀土光纤Er<'3+>/Yb<'3+>共掺双包

基于声学特征的语种识别建模关键技术及实用化研究

与本文相关的学术论文