基于复合双向循环网络特定工况的语音识别研究

来源 :广州大学 | 被引量 : 2次 | 上传用户:wessyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的高速发展,基于神经网络语音识别系统广泛运用于各个领域。对于语音这一类时序的序列,循环神经网络(RNN)具有得天独厚的优势。LSTM(长短期记忆网络)利用不同的门模块控制信息的流入与流出,解决了RNN在训练时梯度爆炸和消失的问题。深层、双向及复合的模型结构在在当今GPU计算能力暴涨的时代,充分发挥出其对时序类强烈依赖前后信息的序列的非线性模拟能力。本文提出一种基于双向LSTM网络的复合结构,并与成熟的语音识别系统作对比,得出在识别效果上的提升;同时提出一种适合这样的复合结构网络的目标函数构造方法,最后通过与成熟的目标函数作对比,验证了其识别效果的提升。具有两个子网络的复合的结构用于解决单纯对语音输入的非线性变换后与目标输出的耦合问题。在提出了复合结构后,尝试提出了一种对目标输出中插入分割符的方法。在训练时,只需找到所有分割的方式,并使这些方式发生的概率最大,进而不必将每帧都和相应的目标对应,大简化了运算。在进行理论推理的过程中,定义了前端变量和后端变量用于表示这样的分割思想,最后推导出目标函数,并完成相应梯度公式的导出。本文的特定工况环境是指在工厂的生产环境。主要任务是在特定工况条件下完成语音识别。对工厂环境噪声分析,提取噪声音素,利用混音软件混入将提取的音素混入训练和测试资料中;在训练阶段,利用已加噪声的训练资料和测试资料进行训练,但目标输出序列则是纯净的音素序列,从而模拟在工厂环境下的语音识别任务。最后,利用Tensorflow深度学习模块及librosa语音模块完成相应程序的编写。由于用于比较的目标函数均以TIMIT语料库作为训练和测试的语料库。所以使用TIMIT进行训练和测试。最终测试结果验证了提出的目标函数识别效果有明显的提升。
其他文献
治则治法是"辨证论治"体系中联系"证"和方药的桥梁,对于治则治法的理解将直接影响到临床的疗效。教材上的描述过于抽象笼统,所以学生学习理解不够深刻,另外,学术界对治则治法
目的:观察Ⅰ、Ⅱ期乳腺癌保乳术后适形调强放射治疗的方法、计量学特点、疗效及副反应。方法:2004年3月~2006年3月的108例接受过保存乳房手术的Ⅰ、Ⅱ期乳腺癌病人,均为女性,
著名学者何思敬,是中国共产党的优秀党员,马列主义理论战线上的杰出战士,法律学家,经典著作翻译家,中国人民大学一级教授。 (一) 何思敬,一八九六年十二月二十日出生,浙江余
建设现代化经济体系是新时代中国特色社会主义经济建设的重要战略任务,是对现代化认识的深化。现代化经济体系建设必须坚持新发展理念的指导,坚持在党的领导下走自主创新发展
目的:探讨HPV感染和E6TP1、Rap1GAP部分外显子缺失与宫颈癌之间的关系,以期揭示宫颈癌发生发展的分子生物学机制。方法:本文采集宫颈脱落细胞200例,采用HC-Ⅱ化学发光的核酸
作为中国现当代文学研究领域中的重要“他者”,过去40年,汉学深刻地影响了国内相关研究的走向。汉学在学术视野、研究方法等方面的“洞见”与“不见”,源于其在西方学术界的
宁左毋右,忽左忽右,左右摇摆,大概是过去几十年中国政治最真实的写照。历史主义地说,左倾思潮与左的实践让中国革命与中国现代化建设付出了沉重代价,胡绳在生命最后岁月的思
随着市场经济的不断发展,国有企业改革逐步推进。国有企业改革工作进行得如火如荼,混合所有制的改革模式开始渐渐被应用。借助混合所有制进行改革对国有企业管理来说具有重要
《咸阳师范学院学报》“陕西方言与民俗文化研究”栏目自2008年创办以来,已发表学术论文160余篇.该栏目能把“方言”和“民俗文化”结合在一起研究,是对“非遗”研究方法的一
为解决卷烟厂在工商交接原烟收购环节中存在的烟丝造碎率高、劳动用工多、强度大、收购效率低等问题,在曲靖卷烟厂该部分作业流程和系统特点的基础上设计了一套原烟卸车装框