语音识别声学模型压缩的研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:seeya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于HMM的连续语音识别中考虑上下文环境的影响,需要做模型基元扩展,模型数目大大增加;为了提高模型的描述精度,模型的每一个状态都由多个高斯分量来描述,所以高斯分量数目多、声学模型空间规模大,存储声学模型所需的内存很大,而且解码过程中为得到状态似然值所需的计算量也非常大,实时性比较差,为了克服这两方而的问题论文研究了声学模型压缩技术,以期找到较好的方法减少存储量的开销并提高解码速度。高斯分量共享和高斯选择两类模型压缩方法成为论文的研究重点。1.研究了高斯分量共享算法,包括传统的高斯分量共享和高斯分量子空间共享,并进行了对比实验。论文重点研究了传统的高斯分量共享算法和高斯分量子空间共享算法,对于传统的高斯分量共享算法,论文从聚类算法和距离测度准则等方面最了研究,优秀的聚类算法和距离测度准则能获得更好的压缩效果;对于高斯分量子空间共享算法,论文从子空间的划分、码本数量等方而做了研究,其中子空间的划分和码本数量对于子空间聚类算法的效果有很大的影响。2.提出了一种改进的基于单音素状态的高斯选择算法。论文重点研究了标准高斯选择算法、标准高斯选择算法的优缺点、传统的改进高斯选择算法以及这些算法的一些不足,为了弥补这些传统改进高斯选择算法的不足之处,论文提出了一种改进的高斯选择算法,经过试验验证,这种改进的高斯选择算法基本解决了高斯选择“状态受限”的缺点,取得了识别率与实时性的一个较好折中。3.提出了一种基于分量共享的高斯选择算法。传统的高斯选择算法只考虑了计算量的减少,并没有考虑内存的开销,因此在资源受限的系统中,高斯选择算法不能发挥很好的效果,为此,论文把高斯分量共享和高斯选择两种思想融合,达到了既能缩减内存开销又能减少计算量的目的。
其他文献
无线视频组播是近年来兴起的一种视频传输方法,其主要用于解决同一区域内大量用户同时感兴趣的视频数据的传输。然而由于无线信道的时变特性与无线接收终端的移动特性,造成组
高抗干扰短波据传输,主要探讨了如何在短波信道信噪比很低的情况下可靠通信的问题.为实现这一目标,该文对原有的数字通信系统进行了一些修改,主要措施有:(1)用半方波对输入信
四溴双酚-A(Tetrabromobisphenol A,TBBPA)是目前全球生产量和使用量最大的溴代阻燃剂(brominated flame retardants,BRFs)之一,在环境中广泛存在,如土壤、水体、大气、食物等,镉(Cd
合成孔径雷达(Synthetic Aperture Radar, SAR)是一种高分辨成像雷达,具有全天时,全天候工作,强穿透性等特点,为目标识别提供了可靠的数据依据。SAR自动目标识别(Automatic T
频繁的自然灾害,使得人们越来越重视起应急通信技术,无论是应急通信车还是卫星电话等方式,都是针对于政府救援抗灾而使用,面对无法及时获取相关信息的灾民,目前还缺少一套有
经过爆发式增长,IP网络的僵化已经显露出来,现有的补丁修补方式虽能有效解决一些问题但并不是长久之计。为了彻底解决IP网络的问题,许多国家和研究机构积极进行下一代网络的
在现代数字通信中,随着数据传输速率的不断提高,码间干扰对通信质量的影响也日趋明显。传统的均衡技术存在的缺陷导致了信道盲辨识和盲均衡技术的产生,并迅速成为通信信号处
随着计算机技术、多媒体技术和网络技术的飞速发展,图像检索正逐渐成为多媒体领域最活跃的研究热点之一。从早期基于文本的图像检索技术的开发到现今基于内容的图像检索方法
目的:从构建的GST融合随机肽库中筛选出抗胃癌细胞株SGC-7901的重组多肽,并对其作用机理进行初步的研究。 方法:应用MTT法进行抗胃癌细胞株SGC-7901的重组多肽的筛选,并检测筛
随着国家平安城市等大型项目的推进,以安防为目的的视频监控行业得到了快速发展,视频监控领域各项技术的逐步成熟,也进一步推动了行业的发展。视频监控系统呈现出了高清化和