基于隐马尔可夫模型的汉语语音识别技术研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:and
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是机器通过模式识别过程把人类的语音信号转变为相应的文本的技术。语音识别拥有广阔的应用前景,同时作为一个交叉学科也具有深远的理论研究价值。   本文首先分析了语音信号的预处理,对语音信号进行了端点检测,滤除了语音信号的无声段和噪声,为语音特征参数的提取提供了有效语音段。在端点检测方面讨论了基于Mel频率倒谱特征的端点检测方法和传统的双门限端点检测方法的性能。相对于传统的双门限端点检测方法,基于Mel频率倒谱特征的端点检测方法具有更高的鲁棒性。   其次本文详细阐述了线性预测倒谱系数(LPCC)及Mcl频率倒谱系数(MFCC)特征参数的提取方法,并提出了改进的LPCCMel特征参数。仿真实验证明使用改进的LPCCMel特征参数的语音识别系统比使用LPCC参数和MFCC参数具有更好的识别率。   最后,本文着重研究DHMM方法语音识别系统,分析、讨论语音识别系统中DHMM状态数选取和码本容量选取的问题。通过对“0-9”十个数字进行了识别实验,得出DHMM状态数为6或7,矢量量化的码本容量为64或128时,可以显著提高系统识别率的结论。
其他文献
说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出说话人的过程,它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景,
人脸识别因其友好、自然、对个人干扰少等优点,成为生物特征识别领域里的佼佼者。虽然基于二维人脸的识别技术在实际应用中已经取得了不错的识别效果,但其易受光照、化妆和姿
脑电信号(EEG)反映了人体神经元的活动,其中蕴含了非常重要的信息,这些信息不仅可以使人类更好的认识大脑,帮助医生诊断和治疗脑部疾病,更重要的是通过对大脑的认识更好的挖
期刊
随着视频内容的丰富,如何对大容量的视频内容进行有效的索引与检索,成为了热门的课题。视频内容中含有大量的文本信息,它们对视频画面起着描述、解释以及补充的作用,因此是视
在波分复用(WDM)系统中,比特速率的急剧提高带来了许多极限性的挑战。比如系统对色度色散(CD)与偏振模色散(PMD)容限降低,非线性效应影响严重,光信噪比(OSNR)劣化等。因此,需要综
本文以FPGA作为控制核心,利用高速A/D电路设计一数据采集系统,系统采集的数据经由USB接口传送到计算机进行显示和分析。系统特点为采样速率高,对采集数据实施实时低通滤波,采集的
期刊
高频通信具有成本低、架设灵活、抗毁能力强等优点,在远距离通信中起着举足轻重的作用。高频信道模拟器,使人们可以在实验室中模拟特定的信道环境,方便了高频通信系统的研究
随着计算机技术、网络技术、电子技术与仪器技术的发展及深层次的结合,虚拟仪器技术及以Internet为核心的网络化测控系统得到进一步发展,使得人们组建复杂、远程和范围较大的