基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:chenshengli406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错误率分别相对下降10.53%、5.17%和2.65%,展示了语音自适应聚类特征的良好性能。
其他文献
坚持实事求是要满足三重要求:道德层面要求讲真话,这是实事求是的应有之义,讲真话必须勇于纠错,要有制度保证,落实广大党员和领导干部讲真话的责任;规范层面要求讲证据,就是
社会支持是指亲人、邻里、公众和社会组织等个体和团体对弱势群体提供的情感、物质、信息等方面的帮助,主要目的是改善弱势群体的基本状况,促进弱势群体的发展。长期以来,社
<正>政治是中学生的一门必修课,也是长期以来中考的一门必考课。要使学生学好政治、考好政治,教师必须注意平时对学生政治思维能力的培养。近年中考试题在考查学生所学政治知
不久前,5部门联合发布的《林业产业振兴规划(2010~2012年)》提出,加强以国家级森林公园为主的生态文化示范基地建设,策划和推介特色生态旅游产品。$$     发展我国森林生态旅
会议
就古代匈奴民族音乐发展情况而言,其制度的完备、形式的多样、内容的多元远不及中原民族,但并非三言两语可了结。若细细梳理,历史上,匈奴民族的草原音乐文化,如民歌、乐器、
目的了解局部变应性鼻炎(local allergicrhinitis,LAR)与非变应性鼻炎(nonallergic rhinitis,NAR)的比例关系,初步分析LAR的疾病特征。方法回访并筛选NAR患者行鼻腔变应原激
人的精神大系统及其太极图式的结构模型 ,以人类工具性和社会性的生存方式为基础 ,大体经历了三个历史阶段而逐渐形成。猿人开始有稳定的、经常性的精神活动 ,但整体上处于潜
为提升岩巷施工水平和掘进效率,阳煤一矿在北翼皮带巷实验应用CMZY1-80/12型钻装机,实现了机械化钻眼、一体化运输,循环进度由1.6m增加到2.0m。
针对煤矿供电系统中的越级跳闸问题,基于电压波动、电气干扰及开关性能的差异性特点的发生率远大于因短路过流产生的概率,因此文中分别从技术现状、设备管理等多角度出发,给