汉语耳语音重建的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:vvf022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音是人与人之间一种特殊的语音交流方式。其具有声带不振动、基频缺失和声音能量低的特性,这些特性降低了耳语音的可懂度和清晰度。耳语音向正常音的转换重建具有重要的理论意义和应用价值。本文基于混合激励线性预测模型,研究了连续汉语耳语音合成重建正常语音的相关技术,主要工作包括:建立了基于混合激励线性预测(MELP)模型的连续汉语耳语音向正常音的转换模型。对耳语音和相应正常语音的混合激励线性预测(MELP)模型的编码参数进行了比较分析。提出了基于Gabor变换的时频域信息熵和过零率的端点检测方法。首先利用信息熵来区分语音的有声段和无声段。其次针对连续耳语音中利用信息熵的端点检测存在着耳语音的语音段误判为无声段这一缺点,利用过零率方法对端点检测的熵值相近熵阈值的语音帧进行修正。提出了基于Gabor时频域对称相对熵的声韵分割方法。在声韵分割中,利用声母和韵母的能量聚集性、共振峰结构以及频谱差异,采用对称相对熵值来分割声母和韵母。实现了基于线谱对(LSP)的共振峰修正,对共振峰的峰值位置和带宽进行修改。在对耳语音中的韵母部分添加基频时,首先基于Bark频带域的功率谱和声调的关系,来判别语音的声调的类型,进而对耳语音声调进行识别,然后利用五度字调模型对语音帧添加基频信息。最后利用修正后的参数实现了基于MELP模型的耳语音向正常音的重建。实验结果表明,该方法能重建较为自然流畅的正常音。
其他文献
随着信息时代的发展,使得人们越来越依赖手机和互联网获取信息,而在这些信息中有很大的一部分都是以短文本的形式存放,因此对这些海量短文本的挖掘能够很好的了解用户的兴趣信息
当今社会对信息安全的要求和依赖程度越来越高,安全的密码系统在其中扮演着核心的角色,而密码协议就是非常重要的一环。密钥协商协议是密码协议中最为重要,应用最为广泛的一种。
随着无线通信技术步入3G/4G时代,人们对广覆盖、高带宽的无线通信网络的需求越来越迫切,特别是当前越来越多的数据服务发生在室内环境下,室内无线网络覆盖变得非常重要。但是
随着无线AdHoc网络的广泛应用和复杂多媒体应用的不断流行,无线AdHoc网络的业务量陡然剧增。如何把有限的无线资源,以合理的方式分配给不同的用户或应用,以满足他们各自对无线资
随着科学技术的高速发展,人们获取数据的渠道越来越多,数据维数也急剧膨胀,如何对这些海量数据进行维数约简,从中提取对人们有用的信息,成为模式识别及机器学习等领域的关注重点。
无线传感器网络的MAC协议工作在网络协议底层,它决定了无线信道的分配和接入方式,对网络的性能有重要的影响,因而在无线传感器网络的研究中备受关注。现有的大部分MAC协议,通常把
大型系统的设计应该采用形式化(Formal Methods)的方法。形式化方法是建立在严格数学基础上,具有精确数学语义的开发方法。形式化技术具有改善系统开发质量和提高工程效率的
地震是地壳快速释放能量造成震动,期间产生震动波的一种自然现象。每年全球会发生约550万次地震,地震的发生往往会造成严重的人员伤亡和财产损失。我国是一个地震多发的国家,
在软件生命周期过程中,软件测试是保证软件质量的关键环节之一。随着分布式系统的不断发展,网络并发软件的测试方法受到了广泛关注与讨论。由于并发实体之间存在着复杂的交互行
随着网络的不断发展,人们在各方面对网络的依赖性逐步增加。现在,以网络为平台的网上购物、网上银行、网上金融交易等迅速盛行,但是消费者也必须对相应的安全问题提高警惕,账