基于汉语教学系统应用的说话人归一化和自适应算法研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:ychhome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机科学的发展使得语音识别技术得到了广泛的发展和应用,但是非特定人语音识别的性能要远远逊于特定人语音识别系统,这主要是由说话人之间的差异造成的。集成了语音识别引擎的计算机辅助语音教学系统,作为一种非特定人语音识别系统,同样也存在着说话人差异造成的缺陷。因此,对包括语音教学系统在内的非特定人语音识别系统,进行说话人归一化和说话人自适应算法的研究是很必要的。本文以汉语语音教学系统应用为目的,研究说话人归一化与说话人自适应,做了以下工作。 基于已有的VTLN算法,本文将VTLN算法中的频率折叠因子搜索范围扩展到0.70≤α≤1.30,实验结果证明经过扩大频率折叠因子搜索范围,语音识别器识别性能有所提高,并且男生说话人和女生说话人的频率折叠因子分布更加趋于合理化。 基于已有的VTLN和MLLR自适应算法,提出了一种将VTLN和MLLR相结合,适用于汉语教学系统的算法,并利用CASIA北方口音语音库对该算法的性能进行检验。实验结果表明,和基线识别率相比,单独的VTLN能够使WER降低10.20%,单独的MLLR能够使WER降低5.30%,VTLN和MLLR相结合使WER降低16.07%。实验结果表明了VTLN和MLLR相结合的算法实现了单独的两种算法性能的叠加。
其他文献
随着科学技术的持续发展与进步,光电跟踪测量设备朝着大型化、复杂化、高速化、集成化以及自动化的方向不断迈进。其结构层次日益复杂,功能更加强大,各种信息技术、智能技术广泛
超宽带(Ultra-Wideband,UWB)无线传输技术以高速率、低功耗、极短脉冲著称,尤其适用于室内等密集多径场所的高速无线接入,建立一个高效的无线个域网(WPAN)。超宽带技术以前用
下一代移动无线通信系统的演进目标是要实现高速率、高质量的移动多媒体传输和无所不在的覆盖。多种关键技术如正交频分复用多址接入(OFDMA)、自适应调制编码(AMC)、混合自动
学位
大豆磷脂是从大豆中提取的含磷的脂类物质的混合物,由于其独特的理化性质,在食品工业中的应用已有很长的历史。现在国内外市售的卵磷脂主要是以大豆磷脂为主。虽然磷脂作为乳化剂,已广泛应用于食品、医药、化妆品、皮革、涂料等领域,但普通大豆磷脂亲水性不够理想,使大豆磷脂的应用受到了限制。 解决此难题的方法之一就是对磷脂进行改性,提高磷脂的亲水性。改性方法包括物理改性、化学改性和酶法改性。由于前两种方法存
说话人识别技术是当今的一个研究热点,在保安、公安司法、军事、财经和信息服务等领域有广泛的应用前景。在纯净的语音下,识别的效果比较好,但是在有噪声的情况下,识别率比较
由于大气湍流扰动的影响,成像跟踪系统中目标的成像发生漂移、闪烁和模糊等降质现象,从而对目标的探测、识别和跟踪等带来了极大的困难。尤其是面临各领域对成像跟踪系统的探测
Adhoc网络是一种不依靠固定基础设施、各移动结点可帮助其他结点转发数据而形成的分布式对等网络。它主要应用在军事通信、抢险救灾和传感器网络等领域,因此,得到军事界和学术
基于数字化技术的多频连续波雷达,结构简单,测量精度高,在外场测量等领域有着广阔的应用前景,对这种雷达的理论算法和软硬件体系结构进行研究,是非常有意义的。   在实际的外场
红树科木榄属(Bruguiera)植物在中国主要有三个种,分别是木榄(B.gymnorrhiza)、海莲(B.sexangula)和尖瓣海莲(B.sexangulavar.rhynchopetala)。三种红树植物在形态上差异较小,
近年来,随着数字技术的飞速发展,越来越多的电子产品如数字电视、手机、个人电脑等,开始走进家庭,为用户提供丰富多彩的多媒体应用和服务。但与此同时,这些电子产品多媒体资