基于HMM和ANN的汉语语音识别

被引量 : 0次 | 上传用户:lyztracy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一门内涵丰富、应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。语音识别正在办公或商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号以及医疗和卫生等领域发挥重要的作用,并且极有可能成为下一代操作系统和应用程序的用户界面。 虽然语音识别已经取得巨大的成就,形成了隐马尔可夫模型、矢量量化、动态时间规正等有效技术,出现了一些比较成功的语音识别系统,但是面临实用化时还是存在一些问题。例如:语音识别系统的适应性差,对环境依赖性强,在某种环境下建立的语音识别系统只能在这种环境下应用,否则系统性能将急剧下降,而且全世界共有上千种语言,每种语言又有许多种方言,随着环境的改变,识别系统的性能也必然会下降。本文着眼于汉语语音识别系统实用中所面临的主要问题,以提高识别率和提高识别系统的抗噪声能力为目的,研究汉语语音识别实用化理论和关键技术。本文用大量的实验和数据来证实了所提出方法的有效性。主要研究工作和取得的成果如下: 1.介绍语音识别系统中涉及到的基本概念及原理,分析一般语音识别系统的结构及所用到的各种理论技术,包括语音识别单元的选取、特征参数提取、模式匹配及模型训练等技术。另外,对语音识别系统的发展史、研究现状、分类方式以及目前所面临的问题等也进行了阐述。 2.系统地研究了语音识别各种主要特征参数的提取方法,特别分析和研究了反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)的提取方法。并且为了反映特征参数的动态特性,本文还提出采用LPCC、MFCC一阶、二阶差分参数来进行语音识别的方法;本文还研究了线谱频率参数(LSF)及其快速求解算法,快速算法所需存储空间更小、各种代数运算次数更少、软件实现更简单。 3.针对噪声环境下的语音识别,本文提出了一种将连续概率密度隐马尔可夫模型(CDHMM)与自组织特征映射神经网络(SOFM)相结合而构成
其他文献
落实"三农"工作,必须通过执行乡村振兴战略来达到,要坚守五大发展理念,以产业兴旺为基本原则,中心思想是要拉动农民增收以及农业提质增效,主要方向是要加紧农业供给侧结构性
<正>陕西省律师协会按照司法部、陕西省司法厅的工作部署,认真学习党的十八大和十八届三中、四中全会精神、习近平总书记系列重要讲话精神,按照十八届四中全会对律师工作提出
目的:评估和分析弥漫大B细胞淋巴瘤(diffuse large B cell lymphoma,DLBCL)患者中程序性细胞死亡因子1(programmed cell death-1,PD-1)和其配体(programmed cell death ligan
针对太阳能面板日常清洁困难且效率低的问题,设计了一种太阳能面板清扫系统,并对其自动卸尘机构进行了优化设计.首先,通过Solid Works建立了太阳能面板清扫系统的三维模型,并
在20世紀末興起的國際傳媒產集團化經營發展潮流中,兩岸傳媒產業開啟了邁向集團化經營發展的序幕,本論文即以兩岸電視產業集團化經營戰略的研究作為目標。以產業外部社會環引
绝经是每个妇女生命历程中必经的过程,而围绝经期综合征(PMS)也是一个发病率极高的常见病。它是指妇女在绝经前后由于雌激素水平波动性下降所致的以植物神经系统功能紊乱为主,伴
伴随着房地产业的繁荣与发展,江西省房地产金融业务得到了快速发展,但是由于房地产融资渠道单一,使得房地产金融风险集中于银行业,对银行业甚至金融业的健康发展带来极大的隐
从成名作《两程故里》到“瑶沟系列”再到“耙耧系列”,阎连科以其对农村社会的真切表现及对农民生存困境的持久关怀成为了文坛的焦点。在世纪之交,伴随着社会的转型过渡,在
虚无主义思想深刻影响了马致远的人生观、价值观和历史观,直接影响了马致远的创作动机、作品主题和审美趣味。 本文通过分析,揭示了马致远虚无主义思想形成的主要原因:当
2012年6月,央行首次允许了存款利率的上浮,将其上限调整为基准存款利率的1.1倍,存贷款利率将首次实现双向浮动。这一调整被视作是中国利率市场化改革的道路上又一个里程碑式