论文部分内容阅读
声音信号是传递信息的重要信号之一。对声音信号的研究一直都受到学者们的关注和重视。随着研究的深入,人们对于声音信号的认识也越来越深入,利用也越来越多。对声音信号进行准确的检测和识别是进行下一步处理的必要步骤。声音信号可以分为语音信号与非语音信号。在语音信号方面,语音信号的检测是语音编码、说话人识别等语音处理的先决条件;在非语音信号方面,准确的识别出信号是什么声音信号,对于人们在生活中对其进行利用有很重要的意义,非语音信号的检测识别在判断物体好坏和安全监控等方面都有很好的应用。本文首先简述了音频事件检测的研究意义和发展历程,以及语音检测和非语音检测两方面的发展现状和发展过程,然后指出本文主要研究内容是语音激活检测(VAD)和安全监控中的异常声音识别。本文对音频事件检测的基本原理与算法技术进行了详细的阐述,由于关于语音信号的研究比较深入和全面,所以对于音频事件检测中用到的技术和算法可以以语音信号检测的框架和技术为基础。整个音频事件检测可以分为两部分,一是特征参数的提取,另一个是模式匹配和模型训练技术。对于特征参数,可以分为时域、频域和同态倒谱系数三大类。对于模式匹配算法,常用的有DTW、HMM、ANN等。接下来论述了VAD的基本原理和常用的经典算法以及异常声音识别系统的发展现状、所用到的技术以及系统的评价标准。然后对本文提出的基于谱相减法和新短时对数能量相结合的VAD算法进行了阐述,主要论述了谱相减法的原理和作用,新短时对数能量的改进思想和改进后的优势。并对新算法进行了matlab仿真和结果分析。对于异常声音识别系统,提出了利用时域特征参数和同态倒谱特征参数相结合的一种多级检测算法,本文中的异常声音针对的是枪声,对算法进行了C语言实现和结果分析。最后,本文对前面提出的算法进行了总结,并对接下来要做的工作和要解决的问题提出了自己的建议。