应力影响情况下的Robust变异语音识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:konashu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要研究应力影响下变异语音的分类和识别两个方面的内容.首先从对应力影响下的几种基于基频的语音特征的分析出发,提出了对应力影响下的变异语音和正常语音进行分类的方法.对航空模拟飞行器中采集的小词表实验样本,特定话者平均分类正确率达到了93.3﹪,多话者分类正确率达到了85.8﹪.然后对应力影响下的变异语音分频带进行了分析,根据结果选用M-MFCC和ExpoLog作为语音特征进行了变异语音识别实验.结果表明采用ExpoLog特征明显优于传统的MFCC特征,对于受应力影响的语音,使用ExpoLog特征的平均识别率为76.7﹪,比没有使用分类器和该特征时提高了11.4﹪.
其他文献
该文对各种特征项抽取方式进行了详细的论述,通常是选取词作业特征项,但对于中文文本而言,因为词与词之间没有天然的分隔符,所以传统的中文全文检索系统大多是以字为特征项.
中医药学是中国传统文化的重要组成部分和人类智慧的结晶,其在人类历史尤其是古代人们与疾病抗争中发挥了重要的作用。中药方剂是中医药学的一门重要学科,其配伍规律有着重要
自由飞行空间机器人FFSR(Free-Flyng Space Robot)又叫机器人卫星,由机器人本体和其搭载的机械臂组成,能在宇宙空间自由浮游和飞行,代替宇航员执行舱外作业.由于它小型、灵活
该文首先介绍虚拟现实的概念、基本要素、实现方式、国内外研究现状;接着讨论了目前流行的两种虚拟场景建模技术,对其作出比较和展望;并通过对已引起当前广泛关注的虚拟现实
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但因Internet所固有的开放性、动态性与异构性,又使得用户很难准确
MPEG-2是一种高质量的图像和声音的压缩编码方案.该文在对MPEG-2编码过程分析的基础上,具体讨论了MPEG-2编码器中熵编码部分的功能及其实现,并完成了其实体的硬件设计及模拟
随着计算机技术的飞速发展,计算机辅助教学在教育领域内的应用越来越普及。同时,也有越来越多的人认识到多媒体网络教学是计算机辅助教学发展的必然趋势。多媒体网络教学系统将
移动互联网的迅猛发展为移动终端的网络通信提供了很多便利,凭借开放性、不受硬件约束等优势,Android操作系统跃居智能系统首位,基于该系统的智能手机、平板电脑、智能手表等
该文对于基于图像的单视点场景建模问题进行了探讨和研究.首先,该文综述了IBM、IBR以及单视点场景建模的各自技术特点和最新研究进展,对所涉及的射影向何、仿射几何及线性摄
随着Internet网络的广泛应用和Intranet技术的普及,网络安全问题变得日益突出,防火墙技术是保护网络安全的重要技术。但是大多数的商用防火墙产品比较昂贵。对于一些规模较小的