基于DFSMN-CTC声学模型的维吾尔语语音识别系统研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:habenladan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度神经网络的兴起,数据、算法和计算能力已成为决定识别系统性能的关键因素。英语、汉语普通话等语言得益于其丰富的数据资源,识别系统性能在日常场景已达到实用化水平。然而对于一些低资源语言,如我国的少数民族语言维吾尔语,由于数据采集和标注等方面存在的各种困难,导致用于训练的数据资源缺乏,其识别服务在实际应用中还面临着许多困难和挑战。针对上述问题,本文基于阿里专有云训练环境将深度前馈序列神经网络(Deep Feedforword Sequential Memory Nerworks,DFSMN)和端到端的连接时序分类(Connectionist Temporal Classification,CTC)方法相结合,对维吾尔语声学建模单元加以改进,在约1万小时中文数据和1400多小时维语数据基础上,利用共享隐层的Fine-tuning迁移学习方法实现了维吾尔语大词汇量连续语音识别系统,将其识别准确率提升至94.48%。本文的研究贡献包括以下几个方面:(1)将深度前馈序列神经网络DFSMN与端到端的连接时序分类CTC方法相结合,基于小规模维语数据做了DFSMN-CTC与深度神经网络隐马尔科夫(Deep Neural Networks-Hidden Markov Model,DNN-HMM)声学模型的对比实验,实验结果表明DFSMN-CTC声学模型性能优于DNN-HMM声学模型。(2)针对CTC方法建模粒度和维吾尔语构词形式丰富以音素、音节和词作为声学建模单元时在大词汇量连续语音识别系统中容易出现集外词的特点,对声学建模单元加以改进,利用Word-piece方法产生的子词作为声学建模单元并做了对比实验。(3)阿里自学习平台需要鲁棒基础资源的输入,针对维语语音数据不足的问题,首先利用部分中文和维语数据验证了迁移的效果,之后基于1万小时中文数据的基础模型采用Fine-tuning迁移方法利用700小时维吾尔语数据重新训练了模型参数,得到基础声学资源作为平台输入。(4)基于机器和人工相结合的方式对实验室录制的用于定制优化部分的740小时维语数据进行清洗、校对,在阿里专有云训练环境,基于基础资源利用740小时维语数据进行了定制模型训练,最终实现大词汇量维吾尔语语音识别系统,将其准确率提升至94.48%。与传统DNN方法相比,本文将维吾尔语语音识别系统识别率提升至90%以上,可以应用在日常场景,为项目的实施提供了技术支持;此外,本文的研究也为我国少数民族语言哈萨克语、柯尔克孜语等的语音识别系统的搭建提供参考和技术储备。
其他文献
全球气候的变化,资源的枯竭及生态环境的恶化,使人类陷入了生态困境。严重威胁着人类的生存和可持续发展的是环境污染,森林破坏,土壤侵蚀和荒漠化等一系列问题。世界各国既要发展工农业生产又要进行基础建设,大量破坏自然植被,造成土地退化严重和水土流失加剧。水土流失破坏了土地资源,导致土地生产力下降,直接制约了农业的持续发展和生态环境的保护。因此,为了防止水土流失,研究输沙过程的规律十分重要。城市小流域泥沙输
在我国经济体制改革不断深入,社会主义市场经济不断发展的背景下,税收作为社会经济的核心组成部分,其重要性日益凸显,国家税务总局树立了“到2020年基本实现税收现代化”的目标。税源管理是税收征管的根基和核心,是体现税收征管水平的主要指标,它对于完成组织收入目的、解析国民经济发展情况有十分重要的作用。随着国家经济和产业结构的动态变化,纳税人数量大幅增长,企业财务避税筹划的手段层出不穷,税源结构呈现出多元
随着网络技术的发展,网络战争越来越频繁的发生,西方国家的霸权主义、强权政治在网络空间也越来越明显。西方发达国家主导了网络战争自卫权的国际法规制,发展中国家参与度低。发展中国家试图努力改变现状,扩大自身在国际法领域的话语权。虽然以中国和印度为例的发展中国家,努力提高自身硬件水平和理论研究,但是参考《塔林手册2.0》,发展中国家的发言仍然是“少数派”。事实上,如果不改变这一现状,未来发展中国家在国际法
随着社会的不断发展,我国城市道路交通越来越发达,与交通相关的网络数据也越来越被人们所关注。本文通过网络爬虫技术采集网络平台的多源异构交通舆情数据,旨在借助于数据挖掘和深度学习的手段对网络交通舆情数据进行深度挖掘和提炼,并提取其中有价值的信息。本文通过探索长沙市的交通舆情动态,提出了基于多源异构网络数据的交通舆情监测研究方法,实现了对长沙市交通拥堵舆情的研究。针对该研究方法,本文主要完成了三个子任务
水中蠕虫类底栖生物(以下简称“蠕虫”)因其耐污性强,在饮用水水源地,特别是湖库类水源地大量繁殖,随原水进入水厂,造成蠕虫污染,严重威胁城市供水水质安全。单独氧化剂灭活虽然灭活率高,但氧化剂投加量高,增加了消毒副产物风险。为此,本研究以典型蠕虫颤蚓为研究对象,采用紫外协同氧化剂策略进行灭活,考察紫外照射对氧化剂灭活效果的提升效果,结合协同灭活过程颤蚓表皮结构的损伤和抗氧化系统变化,探讨紫外照射对氧化
马克思共同体思想是丰富的思想宝库,尤其对资本主义虚假本质的批判和在此基础上建立“真正共同体”的思想是非常深刻的。马克思共同体是对“现实的人”的生活状态的深切关注,对马克思共同体思想时代价值的研究,可为国家治理、和谐社会建设等提供一定的现实指引。同时马克思共同体思想不仅为构建人类命运共同体提供理论基础,而且为其构建提供价值导向。“共同体”并不是马克思的首创思想,马克思共同体思想是特定历史语境下和伟大
随着国家改革开放不断深入、经济社会的快速发展进步,以及人民生活水平的不断提高,汽车早已成为人民大众的主要代步工具。为了更好地对消费者的实际需求进行满足,各地的汽车
随着股权高度分散时代在我国资本市场的来临,上市公司的控制权成为资本市场竞相追逐的焦点。万科宝能的股权之争便是在这一背景下发生的,被称为本世纪以来我国境内资本市场上最激烈、精彩的资本战役之一,吸引了来自社会各界的目光和热议。这一争夺战也揭示了以上市公司控制权之争作为主要争夺对象的收购与反收购战役将成为我国资本市场的新常态。面对“野蛮人”宝能系资本敌意收购的来势汹汹,万科将采取何种反收购手段打一场漂亮
据人口学家估计,到2050年我国失独家庭数量将超过一千万。随着失独群体年事渐高,他们的精神寄托和养老已成为当前社会转型阶段的重要的社会问题。本文在探究C街道失独老人基本情况的过程当中发现失独老人存在支持网络断裂、缺乏子女支撑、缺乏邻里和亲友的支持等问题;养老服务存在联动性、延续性差、社工认同度低、开展工作慢等困境。因此,本文基于社会支持网络理论视角,依托专业社会组织,以小组工作为介入载体,探索社工
随着我国经济的快速发展和经济全球化带来的双重影响,我国企业面临着更激烈的市场竞争和更多经济环境下的不确定性,迫使企业寻求能够提升自身竞争力和抗风险能力的管理方式。