【摘 要】
:
随着语音识别技术的发展以及人们生活需求的变化,许多包含语音识别功能的应用越来越多。然而现实场景中,环境噪声对语音识别效果的影响是巨大的,甚至使得很多产品完全失去了应用能力。其次,许多语音识别应用的载体都是嵌入式设备,这些设备有限的资源和功耗也严重阻碍了语音识别模型的部署。现有的一些语音识别算法,在这两方面还面临着巨大的困难。在对诸多流行的语音识别算法进行研究和对比分析后,为了解决噪声环境下对语音的
论文部分内容阅读
随着语音识别技术的发展以及人们生活需求的变化,许多包含语音识别功能的应用越来越多。然而现实场景中,环境噪声对语音识别效果的影响是巨大的,甚至使得很多产品完全失去了应用能力。其次,许多语音识别应用的载体都是嵌入式设备,这些设备有限的资源和功耗也严重阻碍了语音识别模型的部署。现有的一些语音识别算法,在这两方面还面临着巨大的困难。在对诸多流行的语音识别算法进行研究和对比分析后,为了解决噪声环境下对语音的高效识别问题,本文提出了一种全新的两阶段语音识别模型,该模型将语音特征序列转换成音素序列后再转换成最终的文字序列。其中第一阶段声学模型负责处理语音信号的声学特征,主要由卷积网络结构和GLU激活函数构成,利用CTC损失函数进行模型训练,将语音特征转换成音素。第二阶段语言模型负责处理音素的语言学特征,主要由Bi-LSTM网络结构和自注意力机制构成,利用焦点损失函数训练模型,将音素与文字一一对应转换。在训练过程中,为声学模型的输入使用了语音特征增强技术,为语言模型的输入进行了易错音素随机替换,进一步增强了模型的泛化能力。使用了多个开源语音数据集和大量低成本的文本数据分别训练后,在普通话语音数据集Ai Shell-1的测试集上,声学模型达到了1.31%的音素错误率,语言模型达到了99.42%的文字准确率,整体语音识别模型的错误率低至3.29%,并且总共只有15M的参数量,优于其他开源的普通话语音识别模型。在抗噪声和轻量化方面,该模型有两个主要的特点。首先,该两阶段方法把噪声对语音识别的影响限制在了第一个阶段,将对噪声影响的评估与对整个语音识别精度的评估分开,因此可以对模型进行更有针对性的抗噪优化。其次,两个阶段的模型有更简单且具体的目标,可以采用更精简且有效的网络结构,使用更少的参数量来达到理想的表达效果,所以整个模型能够拥有更轻量的体现。根据这些特点,本文还采用了多个技术,包括特征降噪算法,训练微调,修正损失函数,轻量化卷积,网络剪枝等,在两个阶段分别对模型进行优化,最终得到了抗噪性能更好,更加轻量级的高精度语音识别模型。在-5db到10db范围内信噪比并且包含多种类型噪声的语音测试集上,只有6M参数量的完整模型达到了5.74%的文字错误率,210ms的平均延迟时间。
其他文献
布氏杆菌病是危害人畜比较广泛的一种传染病。为了摸清奶山羊布病现地流行情况,给制定防治措施提供依据,1984年底对北京市顺义县俸伯乡部份奶山羊开展了实验性流行病学调查,现将调查结果报告如下。
以广西南宁市自然保护地内永久基本农田和集体人工商品林图斑为基础研究数据,利用ArcGIS 10.2软件进行融合成斑块,计算各尺度斑块调出的完成度、完整度和综合指数,并进行分析得到最优调出斑块面积尺度。结果表明,集体人工商品林和永久基本农田分别在3.6 hm~2和5.3 hm~2面积尺度能达到完成度和完整度平衡,且在不同权重系数下的效果是一致的,同时结合实际情况,建议广西南宁市自然保护地集体人工商品
“重自然保护,轻文化保护”的实践取向与自然保护地的完整性、原真性保护原则和法治理念相悖。通过对我国第一批国家公园试点地区、国家文化公园建设及其立法例、西方国家法治实践的考察,自然保护地立法需正视、回应与破解自然保护地原住民非物质文化遗产与传统知识产权等方面的一些深层次结构性困境。新时代,生态文明法治建设需坚持“生物多样性”和“文化多样性”二元协同保护与兼顾并重发展原则。《国家公园法》和《自然保护地
国家为迅速建立低碳节俭型、绿色生态经济发展型的新社会,亟需科学合理地规划传输和利用能量的网络系统。而现代电力系统又是生产、运输电网能量的主要承担者,相应地也迫切需要革新内部的管理系统和科技应用。故现阶段,中国国内外都在建设现代的电力系统中,并积极进一步发展智慧电网,这种电网科技有着许多优点,如安全性强、电能利用率高,与中国国内的国情和国家发展战略十分相符。
如何加强对关键岗位人员监督,有效预防腐败问题,云南怒江石油做了有益尝试。国有企业是中国特色社会主义的重要物质基础和政治基础,要将经营管理国有资产的权力关进“笼子”。在做好对国有企业领导人员监督的同时,对基层关键岗位的监督同样重要。近年来,中国石化云南怒江石油公司在“四个强化”做实关键岗位廉洁风险防控工作方面做了有益尝试。
近几年来,我省推广应用布氏猪型二号菌苗,对奶山羊进行口服免疫,收到了较好的防制效果。但免疫后,机体内出现血清凝集抗体,并可传递给羔羊,与自然感染所产生的血清学反应, 目前还没有一个可靠的鉴别方法。这就给流行病学调查,活畜检疫带来一定困难。有关对奶山羊口服免疫后母源凝集抗体在机体中产生、停留、传递及消长规律尚未见报道。为给奶山羊布病检疫及防制提供数据,我们对免疫后母源凝集抗体进行了试验观察,现报告如
习近平总书记在庆祝中国共产党建党100周年大会上明确提出了“伟大建党精神”这一概念,不仅具有极为深刻的政治意义,还具有非常重要的学术意义:一是有效地整合了对建党初期的多重精神表述;二是更为准确地界定了中国共产党精神之源;三是科学地解决了中国共产党精神谱系的完整性;四是蕴涵了我们党一百年践行初心和使命的历程。
伟大建党精神是中国共产党的精神之源,自我革命为我们党跳出治乱兴衰的历史周期率给出了第二个答案。只要大力弘扬伟大建党精神,不忘初心使命,勇于自我革命,不断清除一切损害党的先进性和纯洁性的有害因素,不断清除一切侵蚀党的健康肌体的病原体,我们就一定能够确保党不变质、不变色、不变味。在新时代新征程上,教育部门和各级各类学校的党组织要永远把伟大建党精神继承下去、发扬光大,以高度的历史自觉推进自我革命,培养大
精神状态对每一个民族而言都是极其重要的,它是一种精神层面的动力源泉,良好的精神状态对于国家、民族都具有积极意义,尤其是对于现阶段而言,更需要精神力量来推动,积极引导我们向更好的方向去发展。伟大建党精神的提出,是对中国共产党筚路蓝缕历程的高度概括。据此,本文着重分析建党精神的深刻内涵并指明新时代的发展之路。