移动音频编码丢帧隐藏技术研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:wcqadam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,移动终端上各类型语音、音乐等音频应用需求不断增强。然而,无线移动网络的信道环境复杂多变,导致移动接收端所获得的数据容易出现误码失真,语音传输质量不高、音频通信服务质量较差。现有移动音频的丢帧隐藏技术研究主要面向随机少量语音或音频丢帧的应用场景,无法有效应对突发大量连续丢帧的应用场景。针对上述问题,本论文开展相关研究。本论文在充分研究现有移动音频编码标准AMR-WB+和AVS-P10的基础上,深入讨论移动音频编码的丢帧隐藏技术方法,针对主流的ACELP编码器和TCX编码器,提出了新的满足移动网络高恢复效率、低延时的音频丢帧隐藏方法,使得编码端不添加额外的纠错信息到传输码流中,且解码端不增加延时。主要研究内容和成果概括如下:1.提出了ACELP编码器的自适应丢帧隐藏方法基音周期和ISF参数都是基于ACELP编码的音频编码的重要参数,现有的AVS-P10标准中的语音编码器的丢帧隐藏方法主要是对一些单帧或间断少量丢帧情况下的处理效果较好,而在随机连续丢帧的情况下,丢帧处理延迟较高且语音恢复质量效果欠佳。针对该问题,论文提出了一种自适应的丢帧隐藏方法A-PLC,旨在根据单帧丢失还是多帧连续丢失进行判定,并自动、相适应的采用不同的丢帧隐藏方法,用于恢复丢失帧的基音周期和ISF参数。实验通过与AVS-P10标准中原有方法相对比,其结果表明:A-PLC客观测试PESQ平均得分有约0.13分的提升,主观听力测试的平均CMOS得分提高约0.04分,运算处理时间降低了约10%的时间。2.提出了基于HMM的ACELP编码器丢帧隐藏方法当前主流的语音编解码器对丢失帧的参数恢复方法,主要是基于丢失帧前后正确参数信息进行替换或线性预测来估计丢失的参数值,即只关注了语音信号的局部特征,而忽略了从整体上把握语音信号的全局特征,因而在出现突发大量丢帧的情况下,这些方法恢复的语音信号的听觉感知失真较大。针对该问题,论文提出了基于HMM的丢帧隐藏方法H-PLC,通过分析语音信号在更大范围的上下文关系的统计学变化来选择合适的丢帧隐藏策略。利用连续HMM把每帧语音信号的编码参数向量作为观察值,一个语音参数向量的序列看作HMM产生的连续概率密度函数,在解码器通过HMM跟踪语音参数观察值的变化时,决定每一时刻的最可能的信号状态。当包丢失时,基于HMM的恢复方法使用状态和密度函数信息,计算丢失帧参数的估计值。实验结果表明:H-PLC相比AVS-P10标准的语音编码器原有方法,客观语音测试PESQ平均分提高约0.33分,主观语音测试MOS平均分能够提高约0.32分。3.提出了基于增益控制的TCX编码器丢帧隐藏方法现有变换域丢帧隐藏方法多数采用增益因子来控制谱系数幅度的恢复,这种方法无法有效反映谱系数在不同帧间幅度变化的情况,从而造成恢复的音频信号失真较大。针对该问题,论文提出了一种基于增益控制的丢帧隐藏方法Gain-C,采用线谱频率系数距离用于表征滤波器稳定性,在此基础上,建立稳定性因子和增益控制因子的线性变换关系,从而控制丢失帧谱系数幅度恢复。实验结果表明:在变换码激励模式下,Gain-C与AMR-WB+标准方法相比,恢复的音频信号的平均加权信噪比约有0.05dB的提高,MUSHRA听音测试平均分约有1.5分的提高。论文中提出的移动音频丢帧隐藏方法可直接编码后嵌入到移动音频解码器丢帧隐藏处理部分。相关研究结果表明:提出的移动音频丢帧隐藏方法在丢帧恢复质量和效率方面优于当前主流移动音频编码标准AMR-WB+和AVS-P10中所采用的方法。
其他文献
通常,为了保持饮料的原始风味以及满足生产中PET瓶灭菌的需要,饮料在灌装时必须避免过长时间的受热以及包材输送、灌装等暴露作业时受到微生物污染的机会,企业一般会选择适用范
本文以日本为例从城市环境识别系统和环境的协调性、细节上的微妙处理以及人与环境和谐共生三方面展开分析阐述,对环境识别系统的美学提升和研发的方法进行论述并提出见解。
肝脏不仅是恶性肿瘤最容易发生转移的部位之一,也是导致恶性肿瘤低生存率的重要因素[1] 。阿米巴病是由致病性溶组织阿米巴原虫引起,而阿米巴肝脓肿是阿米巴病最常见的并发症
本文利用1978~2004年的时间序列数据,运用计量方法分析我国农业贷款对农业产出增长的影响。实证分析结果显示:农业贷款对农业增长的产出弹性为负,农业贷款的增加对农业增长并没有
战后初期远东格局发生了极大的变化,两大阵营在远东的对峙发展为军事对抗时,澳大利亚政府采取了追随美国,继朝鲜战争之后又参加了美国发动的越南战争,其亚洲政策又走进了新的
随着媒介环境的改变,舆论引导力弱化。移动终端带来的传播渠道融合,致使传统媒体渠道失灵。社会化媒体带来的传播内容聚合,导致新媒体议程设置失效。舆论引导主阵地要转移到
研究卵泡抑素(FST)对山羊卵巢卵泡颗粒细胞增殖的影响。采集山羊卵巢组织、分离培养原代卵巢卵泡颗粒细胞,RT-PCR克隆山羊FST,设计shRNA片段,构建慢病毒过表达载体和干扰载体
面对整日徜徉于信息网络文化里的“非主流”、自幼成长在都市快餐文化中的“火星族”、时时沐浴着后现代文化气息的“小清新”,我们不禁会问:如今的“九零后”群体会喜欢当下
报纸
目的:应用护理的分层管理,以提高儿科门诊护理质量,满足患儿需求。方法:对护士采用传统管理和分层次管理后患儿及家长满意度、护士满意度、一针穿刺成功率进行分析。结果:传
通过正交试验优选出乌头提取的最佳工艺,即加药材7倍量的95%惭醇搅拌提取3次,每次1h。