论文部分内容阅读
音频分类与分割是音频检索技术的前提和基础,他们为音频结构化和音频信息的深度分析奠定了坚实的基础。基于内容的音频分类属交叉学科研究,涉及众多相关技术,如语音信号处理、模式识别、人工智能、机器学习等。特征提取和分类算法是音频分类研究的关键。
在特征提取方面,本文主要讨论了利用小波分析方法提取音频特征,介绍了基于帧和基于音频例子的特征提取,并提取了质心、带宽、过零率、能量熵等特征,最后介绍了特征值矩阵的构造方法。
在构造音频分类算法时,主要是采用基于SVM的分类算法,并设计了基于不同核函数的分类实验和基于不同小波的分类实验。在基于不同核函数的分类实验时,选取db4小波进行特征提取,然后分别选取两种核函数--径向基函数和多项式核函数,进行SVM的训练和测试,并比较它们的SVM训练速度和分类精度。在基于不同小波的分类实验时,分别选择db4小波和Haar小波提取音频特征,再选择RBF(径向基核函数),来比较选择不同小波时分类性能的变化。最后进行分类实验并结合理论对实验数据进行分析。
实验结果表明,在SVM音频分类中,相比多项式核函数,基于径向基函数的SVM分类在训练速度和分类精度上的综合性能较为优越。此外,还通过db4小波和Haar小波的分类性能比较,发现选择db4小波时,分类精度普遍高于Haar小波,验证了在SVM分类时,db4小波是较好的选择。