语音识别特征提取算法的研究及实现

被引量 : 0次 | 上传用户:l_chuanfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号具有很强的时变特性,在较短的时间间隔中语音信号的特征可看作基本保持不变,这是语音信号处理的一个重要出发点。语音识别率的高低,也都取决于语音信号特征提取的准确性和鲁棒性。因此,语音信号特征提取在语音信号处理应用中具有举足轻重的地位。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。在此基础上本文完成的工作有:1、着重研究了目前使用广泛的美尔频率倒谱系数(MFCC)参数,以24维MFCC参数为例,采用增减分量的方法分析了高阶参数缺失对识别率的影响,找出了对噪音不敏感的高阶MFCC参数,在识别率变化不大的情况下对24维MFCC参数进行了优化组合。2、使用VC++根据动态时间规整(DTW)模型实现了一个连接数字串语音识别系统,并进行了实验分析。系统的组成模块和语音识别系统的基本构成模型一致。在实现时选用了美尔频率系数(MFCC)。3、实验过程中发现了汉语数码易于混淆的问题,在模板训练方法和参考模板两方面做了改进,提出了使用多对特征矢量序列进行鲁棒性训练和进行声韵母分割来构造参考模板的方法。4、最后本文研究了汉语连续语音识别中的声学建模方法,给出了识别汉语易混淆词的方法。本文通过对实际语音识别系统各个部分的实验和研究,为进一步开发实用性语音识别系统的工作做了基础性的工作。
其他文献
有关归化与异化翻译的争论始终是翻译学界研究的重要对象之一。本文将以归化与异化为角度,对威廉·硕特的《水浒传》译文第一章内容中的一些部分进行分析。
近日,由郑州微纳科技有限公司自主研发的U型稀土永磁无铁芯直线电机项目得到国家科技部批准,并获得80万元的资金资助。这是河南省2007年获得科技部创新基金额资助最高的高新技
随着计算机视觉技术的发展以及人们对新的交互手段的需求,基于计算机视觉的交互系统也逐渐发展起来。传统的交互方式如鼠标、键盘、手柄等等在某些特殊领域已经无法发挥便利
随着二十世纪八十年代出生的学生们进入大学和社会,人们发现他们身上出现了越来越多的问题:很多大学生都是独生子女,在家缺乏劳动锻炼。生活自理能力不强。由于家庭或社会的
随着信息技术的迅猛发展,人们的生产、生活及思维方式都发生了巨大变化,电子商务正迅速兴起。在这个崭新的信息化时代,经营方式和营销方式发生了转变,虚拟经营、网络营销进一
通过借鉴新加坡规划的先进经验,深圳市龙岗区紧抓深圳"东进"发展机遇,提出在城市建设上以新加坡为师,全面优化提升城区规划建设,打造"花园城市"龙岗新范式,并通过分享对标工
本文在一定广告理论的指导下,抽取《益世报》发展巅峰的1935年全年广告为研究的总体对象,以创刊号和二十周年号为对比,再采取分类统计、内容分析的方法通过对广告商品、行业
中国石油吉林石化公司的前身是吉林化学工业公司,1954年开工建设,是国家“一五”期间兴建的第一个大型化学工业基地。1957年10月25日吉化“三大化”建成投产,《人民日报》发
网络民主是信息化时代的产物,各学科对这一新生事物的研究都还处于初始阶段,缺乏深入系统的研究。本文在法学视角下通过比较分析、实证分析等研究方法论证我国的网络民主发展
改革开放以来,中国以其巨大的市场潜力和高速的经济增长吸引了大量的FDI。我国最初引进外资是为了弥补资金缺口、创造就业,同时获得国外先进的技术。而中国经济从1994年起就