论文部分内容阅读
本论文研究了压缩音频处理及应用的重要课题,通过对压缩音频处理的研究目的、研究意义和主要方法进行讨论,对国内外研究现状进行综述,本文首先对特征提取的原理和方法进行了分析,并对压缩域中音频的分割、分类检索及用于压缩音频质量评价的时间调整算法进行了研究。
本论文的工作和研究方向主要包括以下几个方面:
研究了压缩音频中特征提取的方法,通过对压缩音频的部分解码,详细给出了压缩音频中实现特征提取的具体过程,为压缩音频的特征提取方法提供了一种思路。
给出了压缩域中音频分割的方法,分析了改进型贝叶斯信息准则(BayesInformation Criteflon,BIC)分割算法,在有效提取压缩音频特征的基础上,使用改进型BIC算法进行了压缩域音频的分割。并通过实验证明了该压缩音频分割方法的可行性和有效性。
在压缩音频中进行了支持向量机(Support Vector Machine,SVM)分类方法的研究,通过对径向基核函数参数的不同组合下分类精度的比较,分析了不同参数组合对分类精度、支持向量个数及分类时间的影响,给出了如何最优化参数并用于压缩域音频分类的新方法。在压缩音频分类的基础上,开展了基于直方图的压缩音频例子检索算法研究,给出了使用改进型直方图匹配算法进行音频例子快速检索的方法。
研究并实现了用于压缩音频质量客观评价的时间调整算法,采用信号包络、频谱互相关及频谱直方图等方法解决了音频质量客观评价中的时间调整问题。该时间调整算法的实现,对BS.1387算法的进一步应用是一个有效的补充。