论文部分内容阅读
语音是人类沟通和交流的重要媒介,进入新世纪以来,语音通信技术得到了广泛研究和飞速发展,支持语音交互已经成为众多移动通信终端设备的必要功能。然而,在很多移动语音通信系统中,空中接口以外的地面部分以明文方式进行传输,具有巨大的安全隐患。因此近年来,移动语音通信系统的端到端加密技术得到了广泛关注和深入研究。其中,基于低速率语音压缩编码和类语音调制技术来实现端到端语音保密通信成为研究的热点之一。本文首先基于增强型混合激励线性预测(enhanced Mixed Excitation Linear Prediction,MELPe)模型实现了一种500bps语音压缩编码算法。MELPe编码模型在低速率语音编码领域展示出了较大的潜力而被广泛采用,论文为了在更低编码速率下获得更高质量的解码语音,对模型进行了进一步的改进,删除了编码参数中的余量谱幅度参数和非基音周期标志,仅保留了提取线谱频率参数、基音周期、增益、带通浊音度和能量参数,来实现低速率语音编码,最终设计实现了一种500bps语音压缩编码算法,并对其语音压缩效果进行了仿真实验。实验结果表明,该500bps低速率语音压缩编码算法合成语音MOS分均达到2.3以上且可懂度均为100%,具有较高的合成语音质量。其次,针对语音通信系统存在的共性问题——呼吸声干扰问题,本文提供了一种以时频特征为基础的呼吸声检测算法,利用短时能量、短时过零率、中低频语音能量比等参数,对语音中的呼吸声进行检测,并作后处理,改善听觉效果。测试显示,对正常语音与呼吸声,运用此算法能够有效区分,从而消除呼吸声干扰,实现对通话质量的优化。由实验可知,本文呼吸声检测算法所处理的语音具有较好的可懂度;且呼吸声的漏检率和误检率分别为4.2%和0.3%,对语音中的呼吸声具有明显的抑制效果。最后,论文基于上述设计实现的500bps语音编码算法和呼吸声检测算法,结合基于遗传算法的类语音调制解调方法,构建了低速率语音保密通信系统,并对该系统进行了实验仿真。测试结果表明,该系统可有效消除呼吸声干扰,在选取的GSM-EFR信道环境下,具有较高的保密性能,并且解密后的语音具有较高的可懂度。