基于听觉特性和神经网络的汉语数字语音识别研究

被引量 : 0次 | 上传用户:guigui1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语数字语音识别(MDSR,Mandarin Digit Speech Recognition)是语音识别领域中一个具有广泛应用背景的分支,在电话语音拨号,门禁系统、身份证号码确认等领域都有重要的应用价值。但汉语数字语音识别存在语音的音节较少等缺点,导致各个数字之间的混淆度很高,识别起来有相当的困难。本文主要研究了目前的汉语数字语音识别技术,并通过改进来提高其系统的识别性能。从基于语音信号产生的数字模型出发,研究了一个完整语音识别系统的各个组成部分,包括前期的预处理、语音模型的训练、识别算法的处理等。本文的主要工作如下:1、在讨论和比较语音信号各种传统特征参数的提取方案,包括线性预测倒谱系数(LPCC)、Mel频率倒谱系数(MFCC)的基础上,研究了基于听觉特性Bark尺度子波变换的语音特征参数提取方案来提高参数的稳定性。初步研究了一种基于生物视觉机制基础上产生的脉冲耦合神经网络来提取语音特征,并对其进行改进。2、在模式匹配上,在讨论传统的动态时间弯折(DTW)算法基础上,提出了基于密度函数估计和贝叶斯决策理论而建立的人工神经网络即概率神经网络(PNN)来建立识别模型。3、对模型训练和识别算法进行了软件仿真,建立了用于训练和测试的数字语音数据库,创建了人机交互界面,并对识别算法的实时性和准确性进行了测试,给出主要的仿真结果和结论。最后提出了本课题今后进一步研究和改进的方向。
其他文献
低碳经济得到越来越多国家的认可和推广,碳金融业务的发展在中国已经势不可挡却没有得到足够的重视。本文拟通过分析目前国内外碳金融行业发展的现状,利用数据深入剖析中国CD
文章对畜禽粪污利用量、现状、模式、方法、措施、资金筹积、建设项目等进行研究,以湖南省洞口县为例,制定可操作性《畜禽规模化养殖场粪污排放达标规范》和粪污排放设施达标
疾病智能诊断是移动式公共卫生应急处置系统中的核心子系统,主要依据疾病的症状、体征及临床化验等信息,对相应疾病做智能化诊断,给突发公共卫生突发事件的现场处置人员提供
在信息少、采集点分散、技术薄弱、地处偏远山岭的流域、水库,如何实时监测水情,保证河道、水库安全,进行灾害预防和控制;提高水资源开发利用、联合调度、科学管理提供决策依
新鲜度对对虾等水产品的食用品质、安全有着巨大影响,新鲜度的高低在很大程度上决定了水产品的食用价值。对虾新鲜度判定对水产品食用安全、运输贮藏及生产加工有着重要意义
胶体金免疫层析法作为一种快速灵敏、操作简单的免疫检测方法,适应于现场快速检测要求,在检测羊乳中是否掺牛乳成分的快速检测方法研究中有重要意义。本课题通过SDS-PAGE和nati
本文介绍了 881 # 印制电路板清洗剂的过程 ,讨论了影响产品性能的主要因素。
海胆含有多种的生物活性物质,具有广泛的药用价值和保健作用。近代中医药认为“海胆味咸,性平。有软坚化痰,散结消肿,治酸止痛,清热解毒的功用。海胆壳中同样含有多种的生物活性物
甘薯渣中果胶含量丰富,约占干甘薯渣重量的20%~30%,是提取果胶的良好原料。本论文探讨和验证了影响酶法提取、纯化甘薯果胶的主要因素,确定了酶法最佳提取、纯化条件,并结合文
<正> 创造性教学,它要求:一、重点突出地揭示课文的思想内容和艺术特色,而不是处处出击,面面俱到;二、在注重课文整体性的前提下,研究把握课文本身的局部或细节的设置,把各个