连续语音识别的稳健性技术研究

被引量 : 7次 | 上传用户：Ares_Stray

【摘要】

：

说话人差异，信道失真和背景噪声导致训练环境和测试环境不匹配，严重影响了非特定人连续语音识别系统的性能。为提高中文连续语音识别系统的稳健性和自适应能力，本文从信号空间、

【作者】

：

徐望

【发表日期】

：

2006年01期

【关键词】

：

语音识别声道长度归一化信道分类信号子空间特征空间能量熵特征补偿不确定解码

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人差异，信道失真和背景噪声导致训练环境和测试环境不匹配，严重影响了非特定人连续语音识别系统的性能。为提高中文连续语音识别系统的稳健性和自适应能力，本文从信号空间、特征空间和模型空间三个方面对说话人归一化、语音增强、端点检测、特征补偿和不确定解码等关键技术进行了深入研究和分析，提出了一些新的思路和方法，并以大量的实验予以证明。本文主要完成了如下工作： 1．将双线性频率弯折方法引入到声道长度归一化中。传统的频率弯折方法存在声道模型假设过于简单，变换后信号频谱带宽改变的问题。本文根据双线性变换中低通滤波器截止频率的映射公式，求出对齐不同说话人或人群第三共振峰的频率弯折因子。利用该频率弯折因子，对Mel滤波器组的位置和宽度进行双线性变换，得到声道长度归一化的特征矢量。该方法避免了对弯折因子的线性搜索，同时还利用了双线性变换使弯折频谱连续且无带宽改变的优点。实验证明，该方法是一种快速的、尤其适用于无监督模式下的稳健性方法。语音特征参数经过声道长度归一化后，在孤立词识别中，成年男性语料训练的基线系统对成年女性语料的识别率从71.50％提高到了91.00％，对儿童语料的识别率从71.00％提高到了84.00％；在连续语音识别中，男性语料训练的HMM声学模型参数集对女性语料的识别率从13.91％提高到了50.56％。 2．采用高斯混合模型(Gaussian Mixture Model，GMM)分类器对测试语句的信道环境进行分类。在多信道环境下进行语音识别时，当基线系统的信道环境与测试语句的信道环境匹配，识别率要明显高于用某一种信道语料或多种信道语料混合训练的基线系统的识别率。如果用各信道的语料分别建立一个GMM模型，信道的差别就转而体现在各GMM的差别上，且具有可分性。本文用各电话信道的洲练语料训练出相应的GMM信道模型和HMM声学模型，在识别时候，对测试语句进行信道分类，选择相应信道下的HMM声学模型对该语句进行识别。实验结果表明，该方法能有效提高多信道环境下的语音识别率。 3．推导了一种基于离散余弦变换和听觉掩蔽效应的子空间降噪算法。本文采用离散余弦变换来逼近本征分解中的Karhunen-Loeve变换，用基于Johnston掩蔽模型的感知滤波器对降噪后的语音进行后置滤波。该方法利用基于离散余弦变换的本征分解快速算法，可将运算复杂度O(N~3)减少到N~2，同时能有效地抑制残差噪声。 4．提出了特征空间能量熵的定义。当背景噪声为有色噪声或噪声能量可变时，传统的语音端点检测方法往往失效。带噪语音的空间可分为正交的信号加噪声子空间和噪声子空间。语音信号是由确定性的非线性动力系统产生，所以它的能量将集中在信号加噪声子空间。而随机噪声的能量在整个带噪语音空间中近似均匀分布。因此语音和噪声具有不同的空间能量分布，有着不同的空间能量熵。本文对语音信号的协方差矩阵进行本征分解，由特征值求出信号在特征空间能量概率分布，提出了特征空间能量熵的

其他文献

贸易、城市化与环境——“环境与发展”国际研讨会综述

<正>由北京大学经济学院、国家发展和改革委员会对外经济研究所、环境保护部环境与经济政策研究中心和中国世界贸易组织研究会主办,北京大学经济与人类发展研究中心和法国威

期刊

农村卫生人力资源低碳城市北京大学经济与人类发展研究中心城市化研讨会综述

以社区为基础的健康管理和健康教育

<正>1社区的健康管理1.1健康的影响因素影响健康行为的因素有倾向因素,促成因素和强化因素[1]。帕森斯认为,个体与社会的关联,决定了健康与疾病的定义不能

期刊

健康管理健康教育社区卫生服务森田疗法理论PDSA循环

中医燥湿同病病因病机分析

本文在复习燥、湿属性与致病特点的基础上对中医燥湿同病的病因病机进行分析,提出燥湿同病的主要病因病机有:①外感燥、湿,合而为病。②脏腑失调,内生燥、湿,挟杂为病。③内

会议

中医燥湿同病病因病机

无线局域网802.11b/11i协议安全机制研究

随着计算机技术、通信技术和网络技术的发展，移动设备和无线技术发展迅速。由于无线局域网(Wireless Local Area Network)具有有线网络所无法比拟的灵活性和便利性，被广泛应用

学位

无线局域网802.11b802.11i数据加密身份认证密钥管理

统计信息咨询服务管理暂行规定

统计信息咨询服务管理暂行规定第一条为适应社会主义市场经济的需要，充分开发和利用统计信息资源，加强国家对统计信息咨询服务市场的规划和监督管理，建立健全统计信息咨询服务体

期刊

信息咨询服务统计师工商行政管理机关统计信息商品信息服务机构

统计信息咨询企业应突出五种能力

期刊

五种能力信息咨询产品和服务公共数据

着力建设一支德才兼备的高素质法治工作队伍

<正>党的十八届四中全会《决定》,对加强法治工作队伍建设提出了明确要求。《决定》指出:"全面推进依法治国,必须大力提高法治工作队伍思想政治素质、业务工作能力、职业道德

期刊

工作队伍建设人才保障思想政治素质职业道德水准检察官公职律师社会主义法治国家律师队伍法治人才培养全面推进依法治国基层法律服务工作

德国年休假法律制度

德国的《联邦年休假法》实施已经有50年,经过多年学术讨论和司法实践的积累,对于年休假请求权的成立、年休假的安排和补偿、年休假工资等问题已经积累了丰富的经验。比如,树

期刊

年休假请求权年休假的安排和补偿年休假工资

黄金周旅游意向暨带薪休假制度调查综合分析

<正>2007年“五一”黄金周是自全国假日旅游协调机制建立以来的第20个黄金周,黄金周出行人数从1999年“十一”的4000万人次,发展到2007年“五一”的1.79亿人次。黄金周长假制

期刊

带薪休假制度假日旅游黄金周旅游假日经济综合分析

上海地区公共建筑能耗现状与节能分析

我国的第十一个五年计划将能源问题提到非常重要的位置，因为这是事关我国是否能保持可持续性发展的关键问题。其中，占据全社会能耗约20％，且逐年呈上升趋势的建筑能耗问题受到各方

学位

公共建筑建筑能耗现场实测空调系统

连续语音识别的稳健性技术研究

其他学术论文