混合激励MVDR语音编码技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:kcb2639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术的发展,语音作为人类交流信息的主要手段之一,在通信系统中占据很重要的地位。由于语音编码速率和合成语音质量这对矛盾的存在,在对编码速率要求比较严格的应用中,对语音的压缩编码的需求尤为迫切,中低速率的语音编码也成为近年来人们关注的热点。 如何准确的建立声道模型和激励模型成为中低速语音编码的关键。现在比较流行的全极点声道模型的参数是通过线性预测(LP)方法来获得的,这种方法并不能提供一个很准确的语音谱包络;另一方面,在中低速语音编码方法中,各种激励各有所长,但都不能很好的描述所有类型的语音激励。这些都导致在中低编码速率下,合成语音质量难以进一步提高。 在声道建模方面,线性预测方法建模谱包络的根本依据是最小均方准则,这可以很好地解析共振峰频率,但是它过分强调共振峰频率处的能量,从而不能很好地建模语音的短时谱包络,导致了谱包络在共振峰频率处会产生尖锐的曲线。本文针对线性预测方法中存在的一些问题,引入了在数组处理中很常用的一种方法一最小方差无失真响应方法,并在建模语音谱包络的性能方面与LP方法进行了比较。然后,在高阶最小方差无失真响应方法的基础上,讨论了缩减阶数的最小方差无失真响应方法,并给出了最小方差无失真响应滤波器系数的计算方法。 在激励模型方面,混合激励模型和码激励模型分别是参数编码领域和混合编码领域的比较成功的模型。研究发现由于混合激励模型能够很好地提取浊音的基音周期,并能良好的描述语音的基音周期波形,所以它具备很好的描述浊音激励的能力;码激励模型是以匹配原始语音波形为目的,所以能够很好的描述清音的激励。本文把这两种模型结合起来,充分利用了它们各自的优点。这里,对采用CE/ME的混合激励模型和MVDR方法的编解码器作了详细的设计,给出了编码器中各种参数的计算方法和比特分配方案。 最后,本文对上述方法进行了试验评价。结果证实,最小方差无失真响应方法在语音编码方面优于线性预测方法,设计的4kbps编码器在主观听音方面略优于4.8kbps的码激励线性预测编码器。
其他文献
本论文主要针对激光成像雷达所成距离像的特点,研究相关跟踪算法在相干探测激光成像雷达距离像跟踪中的应用。 在第一部分中,对传统的强度像相关跟踪算法基本步骤中的模板更