基于MFCC的异常声音识别技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:tang355402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的快速发展,一些潜在的矛盾冲突也伴随出现,异常声音逐渐引起人们的思索和重视。传统安防迫切要求视频监控引入对异常声音的判别,以提高智能性。长久以来,异常声音的识别研究发展缓慢,远远落后于其它声音的进展,主要是人们找不到刻画异常声音本质的特征参数。借鉴人耳听觉特性在听音辩物上的优势,越来越多模仿人耳听觉感知的特征参数被提出,在信息科学领域已显示出巨大发展潜力。本文针对采集的停车场几种典型异常声音,重点研究了一种基于Mel频率倒谱系数(MFCC)及其改进的特征提取方法,并通过支持向量机完成各类异常声音的识别分类。本文主要研究内容有:1、对采集到的异常声音信号预处理,主要包括归一化、预加重、分帧加窗。目的是消除采集过程中声音样本之间数值量级的差异,避免音量忽高忽低对整体声音质量造成的影响,突出各个样本的自身特征。由于异常声音是非线性非平稳的,要经过加窗分帧处理得到其短时信号。为了减少特征提取和识别阶段中的运算量,进行端点检测处理来确定异常声音信号的起始点和结束点。2、针对预处理后的异常声音信号,提取基于Mel频率的倒谱特征参数。在特征提取过程中,利用人耳对声音频率感知的特性,构造一组类似耳蜗作用的三角滤波器,其作用是将每帧声音信号频谱能量由线性频域映射到Mel频域。然后对三角滤波器输出的非线性频谱进行对数变换,最后通过离散余弦变换映射在倒谱域上,完成MFCC特征参数的提取。3、在求取MFCC过程中,针对傅里叶变换有限的时频分辨力以及计算过程中产生谐波干扰的缺陷,采用小波变换进行相应的改进,使得提取的特征参数更加符合人耳听觉特性,改善对噪声的鲁棒性。同时,在特征提取过程中,引入经验模态分解法,挖掘更多的动态特征,从而获得复合改进的MFCC特征提取方法。4、完成异常声音的分类识别。根据对异常声音提取的特征,用支持向量机完成异常声音模型的建立和测试。在训练和测试阶段,通过组合多个二分类SVM来实现多分类识别。根据参数对异常声音模型泛化能力大小的影响,选择合适的核函数类型,从而得到最佳的训练模型,完成对测试样本所属类别的确定。
其他文献
本文对状态空间描述的大系统模型降阶问题进行了研究.大系统的模型降阶作为一个理论课题,自上世纪六十年代末至今日益受到广大控制界人士的关注,提出了大量模型降阶的方法.本
高质量的供配电不但是现代船舶通信自动化的基础而且对船舶的安全航运具有重要意义。供配电管理系统是通过监测到的现场实时信号的状态和操作人员下达的控制指令,产生相应的
由于船舶航行时横摇阻尼很小,在风浪中会产生剧烈的横摇运动,所以在现代船舶运动控制领域中如何更好的减小船舶横摇是一个非常重要的研究课题。舵减横摇作为一种主动式减摇装
随着城市化的迅猛发展和汽车的普及,交通堵塞和交通事故频发,交通问题日益严重.在此背景下,以电子技术,通信技术和图像处理技术为核心技术的智能交通系统(ITS)应运而生.作为I
学位
将数字图像处理技术以及计算机技术相结合的方法应用在医学影像领域,是当代三维医学可视化所研究的重要内容。切片图是肝脏检测诊断的有力工具,但大量切片图像中肝脏内部血管
在现场仪表和工业设备领域,应用嵌入式网络技术是工业控制网络的一个发展趋势,利用Linux 构建嵌入式系统是近年来出现的一种设计方案。嵌入式Linux 系统研究的目的在于利用Li
基于云模型在处理随机与模糊现象方面的优良特征,本文通过查阅国内外资料,深入研究了云模型理论以及免疫检测理论,并把云模型理论引入到免疫检测算法中。对逆向云生成算法进
随着网络技术的迅速发展,网络已经成为了人们获得信息的重要来源,并已开创了一个以计算机网络为基础的信息时代,从而也促进了传统虚拟现实技术在网络上得以实现。网络不仅突破了
随着计算机技术的发展,分布式人工智能中多智能体系统(MAS:Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。机器人足球系统为这一领域的研究提供了合适的工