低速率语音编码关键技术的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:yzyzyzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以特征波形内插(CWI)编码算法为核心,对2.4kbps以下的低速率语音编码进行研究,从语音编码模型和数据压缩两方面出发,力图在更低的编码速率下提高语音合成质量。本文的研究工作主要包括:   (1)对线谱频率(LSF)参数采用瞬时分解方法实现数据压缩。对修正严格瞬时分解算法进行改进,提出了一种有限误差的修正严格瞬时分解算法。该算法重新规定事件插入法则,增加事件消除机制,使分解误差只受预设误差门限控制,实现灵活调节输出事件速率的目的。对LSF参数量化时,新算法能在相同编码速率下,获得比传统算法更低的平均谱失真。   (2)针对瞬时分解算法在对LSF参数数据压缩时出现编码速率波动的问题,提出了一种自适应事件速率的瞬时分解算法。自适应算法检测短时事件速率,预测所需事件速率对应的误差门限,通过短时速率的不断更新,最终使事件的输出速率稳定在预设事件速率附近,从而稳定编码速率,提高了瞬时分解算法的实用性。   (3)对瞬时分解算法的事件函数进行优化。本文通过等级提升算法改进事件函数形状的生成机制。新算法不仅使两事件间的累计重建误差达到最小,同时也保证了事件函数的凸性。与传统事件函数构造方法相比,优化后的瞬时分解算法能够更好地拟合原LSF参数轨迹,增强分解效果。   (4)由于传统CWI算法对特征波形相位信息的忽略,以及对特征波形的整体对齐,往往造成语音高频谐波分量丢失,从而导致语音的噪声感。为提高合成语音的质量,提出了一种基于多带的2.4kbps特征波形内插算法。该算法引入语音多带清浊音标志;并以此为依据对波形内插编码模型中的慢渐变波形和快渐变波形的相位谱进行估计,在语音合成时则对特征波形采取部分对齐的方法。与传统算法相比,新算法明显提高了语音的清晰度。与标准2.4kbps混合激励线性预测语音编码算法相比,该算法合成语音质量亦略显优势。   (5)为进一步降低编码速率,提出了一种基于非负矩阵分解的1kbps波形内插语音编码算法。该算法对特征波表面的幅度矩阵进行非负矩阵分解,以获得局部特征矩阵,并对该局部特征矩阵进行约束和改进,使优化后局部特征更加突出,对应的基矢量进一步稀疏,从而有利于对权矢量的量化,以实现对特征波表面的高效编码。新算法同时加入清浊音标志,对特征波表面的相位谱进行估计,以更好的提高合成语音质量。实验表明,新算法能够在1kbps的低编码速率条件下,获得与1.2kbps混合激励线性预测语音编码算法相近的合成语音质量,取得了较好的效果。   (6)对语音的频带分割进行探讨,提出了一种基于谐波和噪声能量改进的浊音截止频率轮廓估计算法。改进算法中对累积谐波和噪声能量函数进行对应谐波处的功率谱加权,并且在浊音截止频率轨迹的平滑部分采用形态滤波的手段。与原算法相比,通过改进算法得到的截止频率轮廓在语谱图上标注得更为准确,在主观评分测试中改进算法也获得了优于原算法的测试评分。改进算法比原算法能够更加准确的对浊音截止频率轮廓进行估计,从而使得语音谐波/噪声模型在语音编码方面具有更为有效的应用。
其他文献
随着人们对海上通信的要求越来越高,国家对海上人命财产安全越来越重视,为海上作业人员提供灵活可靠的通信手段,为海事搜救部门提供辅助定位手段显得犹为重要。手机作为人们日常
学位
本文主要分析了捷联惯性导航系统(SINS)和全球定位系统(GPS)的组合导航,该组合导航系统采用卡尔曼滤波算法完成组合导航系统的信息融合,以得到高精度的导航信息。首先,本文对
随着普适计算、无线传感网络以及物联网的迅猛发展,位置服务作为一种新生服务开始进入人们视线,早期的位置服务(Location Based Services,LBS)系统主要是针对室外环境。近年
网络控制系统是计算机技术、控制技术和网络通信技术相结合的产物。与传统的控制系统相比,网络控制系统具有可靠性高、成本低和易于维护等优点。随着网络控制系统的规模和复
当前,在移动互联网上基于用户端室内位置的服务日渐增多,如电子商务通过准确定位用户的位置可以进行有针对性的商品推荐;紧急救援(如火灾、坍塌等)通过精确确定营救目标的位
随着信息网络的飞速发展,设备网络化也变得越来越重要。无线设备接入数字化油田监测系统可有效管理在生产中遇到的工作环境差、设备管理和维护不到位等问题。另外,随着信息量
行为识别在安防、人机交互、医疗监护、运动员辅助训练等领域有广泛的应用背景。跌倒检测作为行为识别的重要组成部分,在医疗监护、独居老人监护等相关应用中有重要的应用价值
近年来,随着海上船舶数量的增加和船舶吨位的增大,船舶航行安全问题日益重要,如何保证海上船舶的航行安全是一个迫切需要解决的问题,同时也是许多专家和学者研究的重点和热点
软件无线电作为通信硬件的基础平台在无线通信行业获得很大的发展,它已经成为无线通信的主流技术。数字调制信号具有保密性高,抗干扰性强等优点被广泛应用在通信系统中。因此,自
近年来,随着增强型8.5G光纤通道和10G-Ethernet高速光网络协议的快速发展,对超高速率光收发模块的需求日益增加,同时对模块端口密度及功耗的要求也越来越高。   10Gbit/s光收
学位