基于深度神经网络的中文语音识别技术研究

来源 :华中科技大学 | 被引量 : 1次 | 上传用户:join20102010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,人机交互从单纯的文本指令式交互逐渐转为语音、图像等多元交互方式。语音交互的基础是语音识别,而语音识别的本质是将语音信号转换为自然语言文本。传统的语音识别系统包括语音预处理、语言模型、音素词典、声学模型和解码器等基础单元,本文针对现有声学模型的语音特性学习能力不足问题,根据语音信号的特性和神经网络学习能力提出声学网络模型新方案,并对构建的模型结构进行优化,进而提高中文语音识别系统的性能和效率。本文提出了时延神经网络(Time Delay Neural Network,TDNN)声学模型、TDNN-LSTM声学模型和频谱增强声学模型。时延神经网络声学模型是针对语音信号的上下文相关特性构建的神经网络结构;TDNN-LSTM声学模型是在时延神经网络结构的基础上引入长短期记忆网络结构(Long Short-Term Memory,LSTM)构建的神经网络,该模型对语音信号的上下文相关和长时序相关特性都具有较好的学习能力;频谱增强声学模型使用动态频谱增强方法对TDNN-LSTM声学模型的输入特征进行频谱增强优化。本文使用上述三种声学模型、N-gram语言模型和解码器等基本单元构建了中文语音识别系统,并在中文语料库AISHELL上对该系统进行测试验证。测试结果表明时延神经网络语音识别系统的词错误率为7.51%,相比于传统的GMMHMM语音识别系统词错误率下降了7.58%;TDNN-LSTM语音识别系统的词错误率与时延神经网络系统基本一致,但在保证收敛的前提下训练时间减少了16.76%,;频谱增强语音识别系统则在TDNN-LSTM系统的词错误率上进一步下降了1.42%。基于上述研究结果,本文设计并实现了浏览器/服务器(B/S)模式的中文语音在线识别系统,进一步检验了所提出的语音识别模型的实用性。
其他文献
相变存储器(PCRAM)因其擦写速度快、功耗低、尺寸可不断微缩等优点被认为是下一代存储器的有力竞争者,但是邻近单元间的热串扰成为阻碍其大规模商业化的主要问题,深入研究相变材料的热输运特性对于解决这一问题至关重要。目前关于相变材料热导率的研究,受制于没有简单可靠的薄膜面内热导率测试方法,多是将其当做各向同性材料处理,这种处理方式是片面且不准确的,因为实际相变薄膜的热导率具有显著的各向异性,且各向异性
学位
随着我国经济的高速发展和人们生活质量的日益提高,车辆在人们的生活里已经成了不可或缺的交通工具。对于企业来说,很多汽车或者货车需要统一的管理和信息打通。对于个人来说,自家私家车的车辆状态以及车辆安全是车主最为关心的事情。因此,不论对于企业还是个人,拥有一个方便高效远程管理车辆的平台系统是很有必要的。本课题基于车联网相关技术,对车辆远程管理平台进行了设计与研究。系统设计与实现了车辆信息管理、车辆实时监
学位
目前工业上的运动控制多采用PLC和触摸屏的方式去实现,但PLC的工作原理是按照顺序执行梯形图程序,这种方式的响应速度较慢,灵活性较差;此外,配备触摸屏的PLC控制柜的成本较高,也无法实现实时运动速度显示。为此,本文设计了一种PC和FPGA的运动控制系统,利用PC机的强大功能以及借助visual studio集成开发环境来进行运动控制,此外,所设计的平台还搭载人机交互界面,既能实现对运动进行实时控制
学位
自旋电子学能将电子自旋与电荷两种属性进行有机结合,在集成电路,量子计算机等领域具有广阔的应用前景,是国际研究的热点。稀磁半导体是最有希望实现自旋电子器件的材料,SnO2被认为是最有希望的稀磁半导体材料之一,因此SnO2稀磁半导体吸引了众多的关注,但稀磁半导体的研究仍属于探索阶段。稀磁半导体磁性的起源尚未有明确的结论。本文通过基于密度泛函理论的第一性原理计算方法,以SnO2为研究对象,研究了本征Sn
学位
凭借着可溶液处理、带宽可调以及多激子产生效应等独特的光电特性,硫族铅量子点成为了太阳能电池材料的最佳候选者之一。由于硫族铅量子点带隙较窄,能够有效吸收红外光,因此可与钙钛矿(Eg=1.58-1.68 e V)以及晶体硅(Eg=1.12e V)太阳能电池组成高效的串叠型电池。Pb Se量子点太阳能电池的最高转换效率为10.68%,落后于Pb S方面的14.0%的转换效率。然而目前量子点电池相关研究大
学位
分布式磁异常探测系统具有探测范围广、探测精度高等优势,常用于军事探潜、智能交通、海底监测等领域。但是,由于安装误差的存在,磁传感器阵列中不同传感器的位置和敏感轴方向存在不一致性,称为失配误差。理论证明,失配误差将影响磁阵列的探测有效性。本课题针对海洋应用环境,旨在研究一种简便、准确的方法,对大范围分布式磁传感器阵列进行失配误差补偿。根据应用场景需要,选择使用静态激励法进行磁阵列失配误差补偿。本文从
学位
在光电集成(Optoelectronic Integrated Circuits,OEIC)和光子集成(Photonic Integrated Circuits,PIC)系统中,光电探测器的性能优劣直接决定了整个光电系统的优劣。由于石墨烯的载流子迁移率和光谱吸收特性表现优异,石墨烯在光电探测器中应用广泛。然而,受限于石墨烯的光吸收率及传统矩形或脊型光学波导的传输特性,由此制备而成的光电探测器尺寸较
学位
PTC(Positive Temperature Coefficient)陶瓷发热体是具有正温度系数的热敏陶瓷材料。这种材料加热时无明火、不易氧化且发热恒定,因此被广泛用于汽车、通信和家电等行业。PTC陶瓷发热体在使用的过程中会出现功率衰减、启动时间变长等问题。本文以低压PTC陶瓷发热体为研究对象,搭建一套老化测试系统,通过建模、仿真和实际测试结合的方式开展对低压发热体的研究,主要内容如下:(1)
学位
热释电器件因其独特的热释电效应在能量收集领域有较好的应用前景。传统的热释电型太阳能收集器存在对光的吸收率低的问题,导致器件光热电转化效率较低,产生的信号非常小。本文设计了一种等离子体效应与热释电效应结合的器件,将用于光诱导加热的等离子光学纳米天线与有机热释电共聚物膜(P(VDF-Tr FE))结合在一起,提高了热释电敏感层对光的利用率,并将热波动转化为电信号。该器件也可用于温变能量收集器,将外界环
学位
半导体气体传感器具有灵敏度高、检测对象广、使用寿命长等优点,在大气污染监测、物联网与人工智能领域需求巨大,现阶段发展瓶颈在于金属氧化物较高的工作温度。硫化铅等硫化物半导体具有室温气敏效应,具备发展高灵敏、低功耗半导体气体传感器的潜力。本论文选取无铅、低毒的硫化铋作为研究对象,通过材料可控合成并辅以理论计算,对高性能硫化物气敏材料的设计理论与制备方法展开研究:本文首先通过密度泛函理论计算手段对硫化铋
学位