基于HMM和ANN的汉语数字语音识别算法研究

被引量 : 0次 | 上传用户:hasiwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。到目前为止,语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型(HMM)与动态时间规整(DTW)技术实现语音识别。随着研究的逐步深入,基于线性系统理论的语音识别方法的局限性越来越凸显。近年来,随着人工神经网络(ANN)、混沌、分形等非线性理论研究和应用的日新月异,将这些理论应用于语音识别成为可能。 本文对现有的语音识别技术发展现状进行了分析,介绍了语音识别的基本理论,包括数字语音信号生成的数学模型、预处理、端点检测和特征参数提取。在此基础上,讨论了数字语音识别系统实现的主要技术,重点对HMM模型和自组织神经网络(SOFM)原理及其在语音识别中的应用进行了研究,并且分析比较了它们的识别特性与应用特点,提出了基于CDHMM和SOFM的混合模型原理及算法,该模型由CDHMM产生语音信号的最佳状态序列后,对同一状态应用时间规整网络生成等维的语音特征矢量,并加入到SOFM分类器进行语音识别,HMM-ANN模型既具有HMM对动态时间序列极强的建模能力,又具有ANN极强的静态分类能力。 本文在MATLAB6.5和VC++6.0环境下对HMM模型和HMM-ANN模型的算法进行了孤立数字和连续数字语音识别系统的实验仿真。结果表明,与HMM模型方法相比,HMM-ANN模型提高了语音识别系统的准确率,充分体现出改进模型的可行性和有效性,最后指出了本文研究未来改进的方向。
其他文献
1997年东南亚各国银行系统存在的大量不良贷款引发了亚洲金融危机,使人们充分认识到商业银行不良贷款问题的严重性。我国从计划经济向市场经济转型,这一过程中也产生了大量的
变频产品中普遍使用的智能功率模块IPM(intelligent power modulation)是电力集成电路的一种。该模块具有集成度高,功率因数高,开关速度快和可靠性好的特点,它的智能主要体现
高淳县100户农民家庭膳食营养调查报告江苏省南京市高淳县卫生防疫站(211300)史泽民,汪军,杭化栋为了解我县农民的膳食状况和营养水平,指导农民家庭合理安排膳食,于1992年5月对5个乡、镇100户农民进行
目的了解中国政府应急办网站建设的现状,为加强政府应急网站建设及通过网络加强对公众应急宣教工作提出改进建议。方法通过网络内容分析法对我国364个地级市及以上的政府应急
<正>文章首先阐述了汽车加油站防雷检测的必要性,并对汽车加油站防雷检测的主要项目进行介绍,随后着重对汽车加油站的防雷检测要点进行论述。期望通过本文的研究能够对提高汽
长期以来,关于国际储备的研究是国内外众多经济学者研究的热点问题。一国的国际储备规模是衡量一国债务风险和稳定汇率能力的一个科学指标。一国持有一定规模的国际储备,对于
说话人识别可以被看作语音识别的一种,是当前的研究热点之一。说话人识别是根据包含在语音中的同说话人有关的信息来自动识别说话人,它可分为说话人辨认和说话人确认。 本文
探究式教学充分体现了新课程改革“以学生发展为本”的理念,学科教学革新和学生个人认知发展的要求。与传统传授式教学相比,探究式教学具有开放性、主体性、互动性、创新性、
亚里士多德在伦理学上坚持的是一种典型的中道伦理思想,反对人们行为的过度与不及,希望能理智的、审慎的决定和调控自己的行为,使中道与德性相结合,在现实生活中实现善。本文
进入新世纪以来,随着我国国民经济水平的提升,我国社会的现代化进程也在不断的加快,与此同时,我国的人口问题也已经成为了解决区域可持续发展的关键因素。作为社会经济发展与