压缩域音频特征的研究及其应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:lpt207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究了压缩音频处理及应用的重要课题,通过对压缩音频处理的研究目的、研究意义和主要方法进行讨论,对国内外研究现状进行综述,本文首先对特征提取的原理和方法进行了分析,并对压缩域中音频的分割、分类检索及用于压缩音频质量评价的时间调整算法进行了研究。 本论文的工作和研究方向主要包括以下几个方面: 研究了压缩音频中特征提取的方法,通过对压缩音频的部分解码,详细给出了压缩音频中实现特征提取的具体过程,为压缩音频的特征提取方法提供了一种思路。 给出了压缩域中音频分割的方法,分析了改进型贝叶斯信息准则(BayesInformation Criteflon,BIC)分割算法,在有效提取压缩音频特征的基础上,使用改进型BIC算法进行了压缩域音频的分割。并通过实验证明了该压缩音频分割方法的可行性和有效性。 在压缩音频中进行了支持向量机(Support Vector Machine,SVM)分类方法的研究,通过对径向基核函数参数的不同组合下分类精度的比较,分析了不同参数组合对分类精度、支持向量个数及分类时间的影响,给出了如何最优化参数并用于压缩域音频分类的新方法。在压缩音频分类的基础上,开展了基于直方图的压缩音频例子检索算法研究,给出了使用改进型直方图匹配算法进行音频例子快速检索的方法。 研究并实现了用于压缩音频质量客观评价的时间调整算法,采用信号包络、频谱互相关及频谱直方图等方法解决了音频质量客观评价中的时间调整问题。该时间调整算法的实现,对BS.1387算法的进一步应用是一个有效的补充。
其他文献
光通信技术在过去的几十年发展非常迅速,在我们的生活中的作用越来越重要。其中,光通信系统中的各种光电元件的性能对未来光通信系统的发展有很重要的意义。不过,目前很多光
光纤陀螺(FOG)是根据Sagnac效应来测量系统相对于惯性空间旋转角速度的装置,它具有全固态、体积小、性能稳定、启动速度快、寿命长、灵敏度高、能量消耗低等优点,被广泛应用