基于深度卷积神经网络的中文语音识别

来源 :张昱 | 被引量 : 0次 | 上传用户:shaoshao137
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别作为目前国内外的热门研究领域,对人工智能时代最为关键的人机交互技术的发展有着十分重要的意义。近五十年,语音识别技术发展十分迅猛,尽管传统的语音识别技术已经趋于成熟,但是仍存在多方面的问题:如模型存在过拟合现象;特征学习效果不佳;在复杂环境下识别效果较差等。本文主要从数据集、模型特征提取能力、鲁棒性等三个方面进行优化和改进,进而提高识别效果。以基于深度神经网络的端到端语音识别模型作为基本框架,完成主要工作如下:(1)搭建基于卷积神经网络(Convolutional Neural Networks,CNN)-连接时序分类(Connectionist Temporal Classification,CTC)的端到端声学模型。利用CNN的局部连接和权值共享特性对语音特征图在时频上进行局部相关性建模,再通过其对特征的平移不变性,提高模型鲁棒性。通过将CTC与CNN相结合,简化语音识别流程,完成对输出序列和识别解码过程的优化,实验结果表明,CNN-CTC比CNN的预测错误率降低了1.35%。(2)对基于CNN-CTC的端到端声学模型进行改进。针对模型提取语音特征信息不足导致识别效果不够理想的问题,提出一种基于双分支卷积神经网络的声学模型。该模型通过多种方式提高模型性能。首先增加网络宽度、改变尺度空间,使模型可以在不同尺度空间下分别提取到音频的局部细节信息和整体频谱的轮廓信息。实验结果表明,在增加网络宽度、改变尺度空间后,模型识别效果优于CNN-CTC。为进一步提升模型性能。在卷积神经网络中加入残差块结构,保留原始语音信息,减轻梯度问题,加强不同层之间的特征信息传递;最后加入软阈值非线性转换层与注意力机制,对神经网络提取的特征进行合理筛选,删除冗余特征信息,保留重要特征,进而提高其特征学习能力。对比实验结果表明,最终改进后的模型与基线模型相比词错率下降4.27%。(3)针对模型出现的过拟合现象,通过一种特征图变换方法对语音信号的FBank特征图进行数据增强,增加训练数据同时缓解模型过拟合,提高系统的泛化性能。通过数据增强对比实验,发现该方法有效缓解了模型过拟合,且可在一定程度上提高识别效果。之后将本文最终改进模型与一些主流的研究方法进行对比实验及分析,验证了本文模型具有更好的识别效果和更强的抗噪声性。
其他文献
近年来,我国煤炭开采范围及深度不断增加,逐步朝着深部化和大型化方向发展,工程岩石力学环境随之愈加复杂。泥质岩是煤系地层中分布最广的岩石类型之一,受其所含大量黏土矿物如高岭石、蒙脱石和伊利石等的影响,泥质岩对水分极其敏感,水分作用后易产生体积膨胀、碎胀扩容和强度降低等现象,进而诱发工程稳定性控制问题。软岩工程问题一直是煤矿安全高效生产和建设所面临的严峻挑战之一,目前对软岩工程问题的研究主要集中在大变
学位
黄玉川选煤厂准备车间中煤尘污染严重,多处产尘点的全尘浓度超过100mg·m-3,呼吸性粉尘浓度超过50mg·m-3。现有的喷雾降尘措施难以达到国家标准要求的煤尘浓度,尤其对呼吸性粉尘的治理措施不到位。在喷雾降尘时,表面活性剂作为添加剂能增加水对煤尘的润湿性,可显著提高对呼吸性粉尘的降尘效率。因此本文针对黄玉川选煤厂的煤尘污染问题,进行适用于喷雾降尘措施的抑尘剂优选复配实验及抑尘剂现场应用。实验基于
学位
煤炭行业一直在我国能源供给行业中占有主体地位,但在煤矿开采过程中粉尘的产生给井下的工人们带来了巨大的伤害,煤矿井下高浓度的粉尘严重损害了井下作业人员的身体健康,特别是作为矿井两大产尘地点之一的综掘工作面,由于机械化程度加大,掘进速度快,使得粉尘污染也更严重,这严重威胁着矿井的安全生产。为保障煤矿工人的职业健康安全,改善煤矿作业环境,本文以此为出发点,通过现场实测,实验分析,理论分析和数值模拟的方法
学位
近年来,煤炭市场步入市场化改革进程,煤炭产业链各环节和煤矿生产区域利润分布不均衡的问题突出。为适应全国煤炭市场改革的大环境,促进煤炭企业的高质量发展,全面、综合分析大型煤炭企业的财务问题至关重要。而目前煤炭企业普遍存在管理水平较低、重业务轻财务等问题,并且现行的比率分析方法也存在结构单一、指标体系设置缺乏科学性、分析结果矛盾等局限性,不利于企业精准把握各经营环节的主要问题。为此,改进企业财务分析方
学位
喷雾降尘技术在井下粉尘防治方面应用广泛,其中传统喷雾降尘采用内混式空气雾化喷嘴和X旋流型压力喷嘴,所喷出的水雾雾滴粒径大、速度慢,对于大颗粒粉尘具有较好的沉降效果,但对粒径微小的呼吸性粉尘捕集效率不佳。本团队研制的超音速虹吸式空气雾化喷嘴喷出的水雾雾滴粒径小、速度快,对各类粉尘具有较强的捕捉能力,是新型高效的雾化降尘技术,但有关该技术的雾滴场分布研究等仍需深入。本文重点针对超音速虹吸式空气雾化喷嘴
学位
现代社会,经济的迅猛增长带动了国企改革工作的不断拓展和深化,以经济支柱身份而存在的国企,怎样借助于融资方式和融资结构的优化来为自身提供坚实的现金流保障,彰显出了极强的重要性。然而就实际来看,目前我国国企的融资管理水平还处于发展的中期阶段,国企如何充分发挥自身企业优势,在经营发展战略的辅助下,对融资方式和渠道进行开拓和创新,对自身的融资结构进行优化,对融资风险进行防控,对有关成本进行集约,并在自身经
学位
煤尘防治对高效绿色现代化无烟煤矿井建设具有重要意义。喷雾除尘方法被广泛应用于煤尘灾害防治,而无烟煤煤化程度高,疏水性强,除尘效果不理想。水中表面活性剂的添加可以提高水对煤尘的润湿能力,获得较好的降尘效果。表面活性剂在无烟煤表面的吸附特性以及表面活性剂、水和无烟煤大分子间的相互作用机制,对无烟煤润湿用表面活性剂的筛选,发展高效无烟煤抑尘技术至关重要。本文以晋城无烟煤为研究对象,采用分子动力学模拟与实
学位
当今社会,公务员、军队文职、事业单位等编制类工作逐渐成为大学毕业生的理想工作。编制类考试培训课程的需求也越来越大,各类公考培训机构如雨后春笋般兴起,为广大考编群体所喜欢。公考培训机构属于成人培训,课程收费高昂。学员为了能快速提升自己,成功上岸,对公培机构的授课质量以及课程内容有着高标准的要求。因此,拥有优质的师资队伍是公培机构长远发展的重要保障。但是,民营公培机构教师由于工作强度大,出差和授课的时
学位
任何一个教师想要取得一个好的教学效果,都是无法离开教学语言的。教学语言作为师生之间最直接的沟通方式,其语言规范性、艺术性对课堂展示效果产生直接影响。本文以小学第八届全国中小学优秀体育实践课展示视频小学组体育课教学语言运用作为研究对象,进而寻求体育教学语言运用的规律并提出使用建议。本文为研究小学体育教学语言运用的特征,通过阅读文献了解体育实践课教学语言运用研究的现状,通过数理统计法将教师的使用特点进
学位
有机发光材料具有结构易修饰、发光稳定、合成简单以及发光易调节等特点,在过去的几十年中,人们设计出许多性能优良的有机发光材料,并在生物成像、化学/生物传感、有机发光二极管等领域得到广泛应用。但是,大多数有机分子之间存在π-π堆叠,易导致聚集淬灭现象,这极大地限制了有机发光材料的实际应用。而聚集诱导发射是一种分子在聚集状态下发光增强的现象,这主要是因为在聚集状态时分子运动受到限制。基于此,开发具有聚集
学位