汉语连续数目字语音识别的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：hhkkpump

【摘要】

：

连续数目字语音识别是当今语音识别领域的一个重要研究方向。本文简述了汉语数目字语音识别的发展与现状,分析了汉语数目字语音识别的困难所在,对连续数目字语音识别方法进行

【作者】

：

丁昊

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2005年期

【关键词】

：

连续语音识别特征参数提取 MFCC 参数端点检测 VQ/HMM 模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

连续数目字语音识别是当今语音识别领域的一个重要研究方向。本文简述了汉语数目字语音识别的发展与现状,分析了汉语数目字语音识别的困难所在,对连续数目字语音识别方法进行了研究。选取语音识别系统的特征参数时,对LPC 倒谱参数和MFCC 参数进行了比较,选择能够反映人的听觉对语音感知特性的MFCC 参数作为语音的特征参数,同时考虑到特征参数各维分量对于识别性能的贡献,对各维分量进行了加权处理。实验证明,基于MFCC 的特征参数比LPC 倒谱参数具有更佳的抗噪性。本文还讨论了在语音信号的声学处理环节提高语音识别鲁棒性的问题和方法。利用语音声学信号的频谱分析来寻找连续语音信号帧的分割点,再结合音素分割方法,成功的提高了分割精度。实验表明mel 标度频谱法比传统的以信号的短时能量,过零率等简单特征作为判决特征参数的语音端点检测方法更适合语音的分割。实验结果表明,这种算法对于清音和噪声,以及元音和辅音的区分都有很好的识别性能。系统采用VQ/HMM 模型作为语音识别的声学模型。对搜索算法,识别算法进行了研究,通过对隐马尔柯夫模型输入语音时间序列的矢量量化,有针对性的对搜索算法进行了简化。从而使汉语连续数目字语音识别的系统设计与实现的难度得到了降低。实验结果证明:①系统识别速度快,对于硬件的要求低。能在PC 机上实现处理。②对于平稳的孤立语音,该方法有较高的识别率。③对于连续数目字语音识别,系统的性能并没有急剧下降。

其他文献

基于单/多通道的SAR运动目标检测和成像技术研究

无论在军事和民用方面，利用合成孔径雷达进行地面运动目标检测和成像都具有重要意义，是目前研究的热点。世界上许多国家都在这方面投入大量的人力物力，努力寻找高效实用的方法。

学位

合成孔径雷达动目标检测相位中心偏置天线沿迹干涉杂波自由度成像技术

IEEE 802.16a协议中OFDM系统的同步技术研究

　　本论文描述了OFDM技术的原理、分析了定时偏差和载波频率偏移对OFDM接收机性能的影响，修改、完善并推广了时间精同步算法，使之能为更多协议使用；然后，提出了两种改进的频率同

学位

OFDM时间同步帧定时频偏估计802.16a无线通讯正交频分复用

水声通信网络初始化算法的研究

随着人类对海洋探索、开发的不断深入，无论是军用领域还是民用领域，都对水下通信有着极大的需求。要进行水声通信，首先要建立起可靠的水声通信网络。然而，水声信道的可用带宽窄、

学位

水声通信网络广度优先搜索路由算法初始化算法

基于深度信息的目标检测算法研究

学位

G.723.1用于中波数字广播的改进

G.723.1标准是ITU-T近年提出的双速率(5.3/6.3kbps)语音编码方案,优点是码率较低,非常适合于多媒体通信中的语音编码传输,且能获得较高质量的重建语音,因此成为数字调幅广播

学位

G.723.1ACELPMP-MLQ语音产生模型LSF参数EMM带宽扩展

空时编码和OFDM技术在下一代无线通信中的应用

　　空时编码技术是一种有效的、实用的用于提高多输入多输出系统(MIMO)容量和性能的方法，通过编码使得在不同空间和时间上的发送信号产生时域和空间域的相关性。接收端利用这

学位

MIMO系统空时编码正交频分复用技术下一代无线通信

汉语连续数目字语音识别的研究

其他学术论文