帧擦除掩蔽及其在语音频编码中的应用研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:cxdyc666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来语音编码技术取得了很大的发展,在国际标准化工作中堪称为最活跃的研究领域之一。移动通信和互联网的发展对语音编码算法提出了更高的要求,不仅要求码率较低以增加系统容量,还要求合成语音质量较高以保证通话质量。码流在网络中传输时很可能发生帧擦除现象,帧擦除会导致码流中所包含的语音信息受损,致使解码出的语音质量下降。因此,解决网络传输中的帧擦除问题已成为现今语音与音频编码的研究热点之一。本文针对帧擦除问题进行了研究,提出的帧擦除掩蔽方法可以有效的解决此问题,保证重建语音信号的质量。   首先,本文从变换域角度对擦除帧进行掩蔽。主要考虑的变换有:调制叠接变换(Modulated Lapped Transform,MLT)、修正的离散余弦变换(Modified Discrete Cosine Transform,MDCT)、修正的离散正弦变换(Modified Discrete Sine Transform,MDST)与移位的离散傅立叶变换(Shifted Discrete Fourier Transform,SDFT)。通过对以上变换的性质、相关性与复杂度进行比较分析,最终选定在MLT与MDCT域进行帧擦除掩蔽方法的研究。在变换域,掩蔽方法从变换系数的幅度和符号两方面进行考虑。将所提出的算法应用于G.722.1编码器后,对其进行测试,测试结果显示该算法有效的掩蔽了擦除帧信息。   其次,本文根据语音信号的分形结构,提出一种基于分形的帧擦除掩蔽方法。该方法基于G.722.1编码算法实现,结合语音的特点并利用分形方法对擦除帧进行掩蔽,从而提高发生帧擦除情况时合成语音的质量。经ITU-T的客观PESQ(Perceptual Evaluation of Speech Quality)评测,在发生帧擦除现象时,该方法能够有效的提高解码语音质量。   最后,本文将所提出的基于分形的帧擦除掩蔽方法应用于一种嵌入式语音频编码器中,通过测试表明该算法满足编码器的要求,取得了良好的效果。
其他文献
轮廓提取是图像处理、计算机视觉、模式识别等领域中重要的前处理过程,在视觉匹配、运动跟踪、3D目标重建、图像识别等方面有着广泛应用。而在轮廓提取技术基础上发展起来的
无线传真技术是一项新兴的无线通信增值业务。无线传真是传真数据业务一个非常重要的方面。无线传真技术的发展为传真系统的应用开拓了更加广阔的空间。   调制解调技术是
学位
随着无线通信技术的飞速发展,频谱资源变得越发紧张。在当前无线频谱固定分配的管理框架下,大部分频谱资源处于低利用率的状态。认知无线电(Cognitive Radio)能够动态的利用时
随着超高声速飞行器的迅猛发展,超高声速目标探测雷达的研制也越来越迫切。雷达系统的核心是信号处理算法,研究快速有效的超高声速目标回波处理算法是必要的。研制一款雷达需
随着Internet的快速发展,数据业务在骨干网上保持持续快速增长,其中以IP业务尤为突出。而传统IP承载网采用的SDH技术不能充分利用光纤资源且网络配置缓慢、操作繁琐,因此制约了I
伴随着UWB技术在通信领域应用的逐渐扩展,对UWB技术的理论研究也随着更加深入。作为UWB关键技术之一的TH(Time-Hopping)技术,学界也开始把很多的目光投向这里。而TH技术中的
三维卡通人脸动画是非真实感绘制领域的一个新分支,它是图形学的一个研究热点。随着动漫影视、电子游戏、虚拟会议等方面的飞速发展,对这一领域的研究逐渐增多。本文阐述了卡
随着移动通信系统的不断演进,除传统话音业务之外的移动多媒体业务逐渐成为未来移动通信系统中的主流业务。对于移动多媒体业务的支持,需要移动通信系统能够提供很高的数据速率