基于小波和支持向量机模型的音频分类研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:new37143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的内容语义和结构化信息是音频信息深度处理、基于内容的音频检索以及辅助视频分析等应用的关键。基于内容的音频分类作为解决音频结构化问题的核心技术,是当前音频内容自动分析领域的一个研究热点。支持向量机SVM(Support Vector Machines)是近年来机器学习研究的一项重大成果。作为一种新的机器学习方法,SVM能较好地解决小样本、非线性和高维数等实际问题,因此成为继神经网络研究之后新的研究热点。本文围绕音频分类的两大技术难点——特征分析与抽取以及分类器设计展开研究,主要内容如下:(1)概要地介绍了SVM的基本理论,提出使用多类分类方法来研究音频分类。(2)本文从帧层次上分析了不同类音频之间的区别性特征,对车鸣声,钟声,风声,冰块声,机床声和雨声等六类环境音进行分类。实验结果表明,基于SVM多类分类器的环境音分类性能较好,最优分类精度达到97.73%。(3)介绍了小波分析的理论知识,并尝试了结合小波分析和傅立叶分析进行音频特征抽取,其中对子带能量比和子带过零率等采用小波分析抽取,MFCC(Mel-Frequency Cepstral Coefficients)特征则采取傅立叶分析抽取,并在本文提出的SVM多类分类器上实现六类音频分类。结果表明该方法是一种有效的音频特征抽取方法,分类精度高于帧层次特征抽取。
其他文献
该文主要工作是导航系统检索子系统的设计与实现,其它两个子系统是搜集抽取子系统和分类子系统.检索子系统在文档搜集、信息抽取及分类器相关工作的基础上,完成构建索引器,数
该文讨论了雷达的信号产生和采集的相关板卡的设计与开发,重点是某雷达仿真系统中的基于SHARC-PAC总线的DDS子板、某脉冲雷达中的多通道中频采集板卡和多通道低频信号采集板
脉冲超宽带(IR-UWB, Ultra Wide Band Impulse Radio)通信技术采用直接发射纳秒级、亚纳秒级的极窄脉冲来传输信息,具有传输速率高、安全性好、系统结构简单、穿透能力强、低
RAKE接收机技术是CDMA扩频通信的关键技术之一,该文围绕RAKE接收机在WCDMA中的应用,着重对RAKE接收机中的扩频地址码的捕获、信噪比评估、信道参数估计、和空时二维RAKE接收
该文研究的主要目的是研究如何针对GPS定位信号进行干扰,从而降低甚至破坏其定位信号导航的功能.在该文的开始介绍了GPS的系统构成,分析了GPS的定位信号,在此基础上着重分析
该文主要从提高立体编码效率的角度研究视差估计和基于视差估计与补偿的立体视频编码,做出了一些改进和创新性的工作,不仅在理论上进行深入分析,同时给出大量仿真实验加以验
随着信息产业的飞速发展,人们对于卫星通信的需求更加迫切。低信噪比高动态同存条件下的载波同步技术是实现卫星通信的基础。载波同步技术包括载波的捕获技术与载波的跟踪技
该文通过对国内外反舰导弹导引头抗干扰技术现状及发展趋势的分析,提出导引头抗干扰最终要由基于先进的信号与信息处理技术的抗干扰软件算法实现,并深入系统地研究了基于小彼
如今,在对信号处理实时性要求非常高的领域,特别是在雷达信号处理中,需要有足够快的信号处理能力和高速数据传输率,从而实现对高速大容量数字信号的实时处理和传输.该次课题
语音压缩编码技术一直是语音通信中一项最基本、最重要的技术,而声码器则是语音压缩编码技术的一种具体实现.完成高性能声码器芯片的设计对提高信道的利用率以及数据加密能力