语音识别技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:hnaylz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别拥有可观的应用背景,同时作为一个交叉学科也具有深远的理论研究价值。本文分别采用动态时间规整模型和隐马尔科夫模型,实现了孤立词语音识别方案。并探讨语音识别在硬件上的实现以及基音周期估值等具体问题。 语音识别的理论模型对系统的构建具有指导意义,本文首先分析了语音识别系统的层次结构,阐明不同任务的模型选取问题。然后按照方案处理的步骤详细的论述了语音识别的流程,并应用动态时间规整模型实现孤立词识别。 隐马尔科夫模型对时间序列具有很强的建模能力,通过对时间序列的特征参数的训练,为每个语音建立一个隐马尔科夫模型。待识别语音通过与各个隐马尔可夫模型匹配,即得到识别结果。论文在Windows平台上仿真和编写了预处理、端点检测、特征参数提取、K均值聚类法初值设定、语音模板训练、隐马尔可夫模型识别几个子程序模块,实现了语音识别的各个过程。并用汉语数码识别验证了办案的可行。 文章最后探讨了语音识别算法在硬件平台上的移植,重点考虑流程的改变、数据的处理和算法实时实现几个问题。结合FPGA特点,讨论简化短时自相关函数法实现基音周期的估值,并介绍单bit方法应用于语音信号频域分析。
其他文献
该研究对语音知识在提高学生听力水平,尤其是听写水平的效果进行了实验。实验以两个英语本科班作为研究时象,分别标为实验班和控制班。经过一个学期的语音训练后,对两班测试成绩
自八十年代以来,机械力化学在研究物质被施加机械能量时的化学性质和化学反应等方面的变化中有了一定的发展,从研究的对象、机械粉碎的方法和研究分析手段三方面取得了进步。
美国大学校际体育运动经过一百多年的发展,已由最初自发的体育活动发展为目前十分完善的竞赛组织体系。并对美国竞技体育的发展起到了不可估量的推动作用。美国大学体育之所以
目的探讨肛瘘术后患者长强穴注射亚甲蓝的镇痛效果。方法将84例肛瘘术后患者随机分为观察组和对照组各42例,对照组术后给予双氯芬酸钠栓1粒塞肛,观察组术后在对照组基础上采
介绍固体氧化物燃料电池的相关技术及发展现状,并基于专利对固体氧化物燃料电池技术展开深入研究,从技术的总体趋势、技术重点、机构情况三方面探讨该技术的发展趋势,为该领域内
目前,随着高科技的飞速发展,使得网络成为了人们日常生活中必不可少的重要组成部分,它结合了线上线下虚拟与现实之间的交换。伴随着网络的强大,网络消费也走进了人们的生活,
目的研究医院药事管理在临床药学服务中的应用价值。方法提取我院在2016年3月—2017年3月收治的200例患者作为调查对象,将行药事管理前收治的100例患者作为参照组,行药事管理
热定型对疝修补片结构参数有很大的影响,为了提高疝修补片的顺应性,采用正交试验的方法探讨热定型的温度、时间和外加张力对不同组织(经缎、经平与经缎复合、变化经平)补片结
在Mg-Y-Cu合金中添加0.4%Sn的基础上,研究了0~1.4T的直流磁场对Mg-Y-Cu-Sn合金凝固组织、结晶取向及力学性能的影响。结果表明,随着磁感应强度增加,合金的晶粒尺寸先减小后增
随着经济全球化的发展越来越迅猛,我国社会经济的发展也在不断提高,人民财富逐渐累积,致使闲置钱款增多,人们视线开始从实业逐渐转移到投资行业中来。目前来说,投资行业的参与者大多为商人或者对投资有所研究的行家等,普通居民因渠道来源等问题,投资业涉足甚少,有些居民不了解投资业,面对巨大的投资回报时容易被诱惑。许多人也借此现状,采取非法集资方式牟取暴利,致使投资业市场紊乱,对于真正缺乏资金,需要融资周转的中