噪音条件下的语音识别研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:xdt1973
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对噪音条件下的语音识别进行三个方面的实验研究,提出适合在噪音条件下进行识别的算法。针对通常谱熵法只能在15dB环境下工作的特点,本文提出谱平坦度法,可以在0dB的恶劣环境下稳定地工作。在特征提取过程方面,通常都是取12维MFCC参数。本文利用临界带进行滤波器组选择,加入了听觉响应时间平滑,并适当取舍MFCC成分,仅用3维的MFCC,大大降低了MFCC维数和训练算法复杂度,加速了模型收敛,提高了模型输出概率。实验证明,进行平滑后,模型训练时的输出概率是原来的200倍,说明找到了更好的中心。在模型方面,本文抛弃了状态转移矩阵和初始概率向量,采用音位设置HMM状态数,取得很好的识别效果:一方面可以避免数据不足情况的发生;另一方面,状态数目减少也能提高收敛速度和识别速度。
其他文献
本文对基于粗集的约简和分类方法进行了系统深入地研究。总结了现有方法,并对一些算法进行改进,进而提出了几个新的算法。主要工作如下: 首先给出了可分辨矩阵的概念及基于可
游戏引擎作为一种新的游戏编程模式,在一定程度上提高了游戏开发的效率。游戏引擎中的资源管理是对各种资源进行统一管理并提供统一接口的组织方式,它是游戏引擎中的重要组织
集群通信系统是多个用户共用一组无线电信道,并动态地使用这些信道的专用移动通信系统。MPT1327 是专用信令信道集群移动通信系统的一种公开的典型信令。MPT1327 是一种模拟
由于传统的SPC要求控制特性满足相互独立并服从正态分布等前提条件,造成了SPC的局限性。针对SMT中的一些特殊问题,本文进行了探索,改进了传统的SPC,使之能较好的控制这些特殊的问
信息科学发展到今天,企业对可以在线访问及不断更新的数据的依赖达到了前所未有的程度。不可预计的事件可能会限制数据的访问,严重地影响企业的运营。而且,自然灾害等事件会
本文描述了线性可分与线性不可分支持向量机以及支持向量机如何利用核方法来解决非线性问题。同时,还讨论了支持向量机的训练算法以及惩罚参数不对称的支持向量机。由于支持
由于多元时间序列流广泛的存在于工业生产过程、商业活动和自然科学等领域中,因此,研究多元时间序列流中的知识挖掘是很有意义的。对多元时间序列流知识挖掘的一个重要的研究方
在网络应用范围越来越广,网络服务越来越便利的情况下,网络安全是人们不得不面对的一个难题。网络中的各种资源和重要信息无时不受到各种不安全因素的威胁。最近一次黑客的大
本文以空间GPS 数据接收及其定轨应用为背景,开展GPS 辅助处理单元的开发和研制以及地面检测系统研制工作。本文首先调研了GPS 相关的基础知识,对GPS 辅助处理单元的软硬件需
企业信息化的进程的正在加快,伴随着底端控制层的日益成熟,以及高端ERP的逐步完善,人们开始认识到,要实现真正浑然一体的企业信息化系统,介于中间层的部分变得至关重要。作为企业