基于多特征参数混合语音识别系统研究与实现

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zhiming0077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的迅猛发展,语音识别技术被广泛应用于各行各业。本文在分析和总结前人研究的基础上,提出了基于多特征参数混合的研究思路,以此来解决在识别率和鲁棒性方面存在的问题。由此可见,如何提取高效全面完整的语音特征信息成了本文研究的重点。具体研究内容如下:  1.简单了解了语音识别的发展现状,结合识别模型分析了系统组成结构及其原理,并对涉及的算法进行了数学推导和实验仿真,同时比较了常用语音识别算法的优劣。  2.重点研究了时域和频域特征参数的提取算法以及参数混合方法。常用的时域和频域特征参数包括短时过零率,基音周期,短时能量,以及线性预测倒谱系数(LPCC),梅尔倒谱系数(MFCC),伽马通滤波器系数(GFCC)等。针对以上每个参数给出了详细的提取算法,并比较和分析了各参数的优缺点,在综合发声机理和人耳听觉特性的基础上,提出了时域和频域参数混合的方法。然后对主成分分析(PCA),K-means聚类,Fisher准则等数据降维方法做了简单推导,依照各参数特点,提出了两种混合方案:第一种是PCA与K-means相结合或者单独使用的方案,第二种是Fisher与K-means相结合或者单独使用的方案。最终用MATLAB完成对各特征参数提取算法和混合方法的仿真,实验表明,在不同信噪比下,第一种混合方案混合特征参数比单一参数平均识别率高2.6个百分点,第二种方案高4.1个百分点,但二者的运行时间并无较大差异。  3.仿真了整个系统,证明了混合算法的可行性,尤其对比了两种混合方案下基于DTW或HMM识别系统的实验结果,结果证明在平均识别率方面后者比前者高6.6个百分点,但在运行时间方面前者比后者平均少1.7s。并依照DTW的软件仿真流程搭建了一个基于TMS320C6713 DSK的孤立词识别系统,经多次实验给出了实验结果,证明在正常实验室环境下系统识别率为89.63%。随后给出了对整个研究工作的总结,为下一步工作提供了思路指明了方向。
其他文献
随着多媒体等业务的大量出现,迫切需要Internet提供QoS服务,IntServ、DiffServ及MPLS等技术应运而生。由于IntServ扩展性差而不能在网络上大规模实施;DiffServ虽然扩展性好,容
随着科学技术的发展,很多工农业现场对环境的温度提出了越来越高的要求,因此对这些领域的环境温度进行有效的实时监测成为一个必须解决的问题。特别是随着大型暖棚、花房和温室
随机共振是一种非线性现象,其本质是当信号、噪声和非线性系统间达到某种匹配关系时,噪声的部分能量可以转移到信号上,从而提高输出端信噪比。随机共振算法快速、高效,并可通过硬
期刊
园林绿化是工程项目里面非常重要的一部分,对于园林工程的成败也具有决定性的意义,同时,它还关系到工程的经济效益,以及社会效益和环境效益等多方面的效益。虽然近几年我国园林绿
拒绝服务攻击是近年来互联网的重大威胁,这种攻击使得计算机系统或者网络无法正常运转,从而使得合法用户获得的服务质量降低甚至无法获得服务。经过十年的发展,拒绝服务攻击呈现
宽带网是承载多种业务的网络平台,基于IP的视频监控系统可满足用户的多种需求,是宽带网可视通信业务的重要组成部分。IP视频监控业务是一种基于宽带网络为用户提供图像和各种
期刊
近几年随着传感器技术、嵌入式技术、无线通信技术和网络等技术的飞速发展和日益成熟,在世界范围内开始出现了具有感知、数据处理和短距离无线通信功能的传感器,并且由这些传
期刊