用共振峰轨迹提高汉语数码语音识别性能

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:nikaixinma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在汉语数码语音识别( M D S R)中,“2”和“8”是最易混淆的一对语音。文章分析了“2”和“8”混淆的原因,发现可用于分辨“2”和“8”的区别特征在于其共振峰轨迹的差异。因此文章提出了基于共振峰轨迹的判决算法( F T B D)来分辨“2”和“8”。实验表明,使用 F T B D 算法,使 M D S R识别率从960% 提高到 977% ,“2”和“8”的识别率从 91% 提高到99% ,消除了这对语音的混淆,提高了 M D S R 的整体性能 In Chinese Digital Speech Recognition (MDSR), “2” and “8” are the most confusing pairs of voices. The article analyzes the reasons for the confusion between “2” and “8” and found that the distinctions that can be used to distinguish “2” and “8” are characterized by differences in their formant trajectories. Therefore, the paper proposes a formant algorithm based on formant loci (F T B D) to distinguish “2” and “8”. Experiments show that using F T B D algorithm, the recognition rate of M D S R is improved from 96.0% to 97.7%, and the recognition rate of “2” and “8” is increased from 91% to 99% Obfuscation of speech improves the overall performance of MDSR
其他文献
医疗卫生设施是城市公共设施的重要组成部分,已有研究项目对医疗服务的公共政策效应关注极少,致使医疗设施规划落地性差,实施性不足,我国小城镇医疗卫生资源总量不足、质量不
本文针对我国盐化工业企业日常发生的配电变压器烧毁的现象,通过长期跟踪了解,调查分析和现场测试,提出了有效的防范措施,包括加强计划管理,科学配置避雷设施,做好维修保养等。
198 7年 5月 2 6日 ,江泽民同志在上海市地方志编纂委员会成立大会上 ,就地方志工作发表了著名的讲话。讲话高屋建瓴 ,以马克思主义的历史唯物主义观点 ,精辟阐述了地方志在
FO5A模块体积小,引脚为单列直插,SMT树脂封装,采用声表谐振器稳频,频率稳定度高,一致性好,无需调整频点,特别适合要求体积小、稳定度高的多发/收无线遥控及数据传输系统。外形尺寸为s
本文以RSA体制为例,提出了密钥分配的自产生密钥式协议,详细分析了协议的安全性,并且在此基础上进一步提出了分布式的协议。两协议能比较好地满足网络开放环境下的密钥分配管
本文通过对工业盐中碘离子含量形成原因进行了阐述和分析,并结合蓬莱盐化公司当前实际情况,在传统降碘、控碘措施基础上,进行了新的降碘、控碘措施探索,包括加强各单位、部门
受地方政府形象广告和快速消费品广告增长带动,中国广告业出现了一个小阳春,但即便形势好转,中国广告业依然在经受产业升级的阵痛——意外反弹出乎所有人预料,中国广告业的好
以四川遂宁蓬莱岩盐矿体卤水的特性为线索,从分析卤水中还原性物质的性质和危害入手,阐述了食盐翻红(绿)的诱因,提出了解决问题的办法和关键点,只有用化学的方法将H2S从卤水中
多家办保险竞争局面的出现和外国保险公司的打入,使人保公司一统天下的格局被打破。面对现实,越来越多的人保同仁已深刻认识到,要想在竞争中立于不败之地,继续发挥保险主渠
主要通过对真空制盐企业生产过程中常见故障进行分析总结,并提出解决生产故障切实可行的方法,从而降低生产故障率,增加有效生产时间,确保生产连续稳定运行,降低生产运行成本,