音频事件检测算法研究

被引量 : 0次 | 上传用户:yangpin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声音信号是传递信息的重要信号之一。对声音信号的研究一直都受到学者们的关注和重视。随着研究的深入,人们对于声音信号的认识也越来越深入,利用也越来越多。对声音信号进行准确的检测和识别是进行下一步处理的必要步骤。声音信号可以分为语音信号与非语音信号。在语音信号方面,语音信号的检测是语音编码、说话人识别等语音处理的先决条件;在非语音信号方面,准确的识别出信号是什么声音信号,对于人们在生活中对其进行利用有很重要的意义,非语音信号的检测识别在判断物体好坏和安全监控等方面都有很好的应用。本文首先简述了音频事件检测的研究意义和发展历程,以及语音检测和非语音检测两方面的发展现状和发展过程,然后指出本文主要研究内容是语音激活检测(VAD)和安全监控中的异常声音识别。本文对音频事件检测的基本原理与算法技术进行了详细的阐述,由于关于语音信号的研究比较深入和全面,所以对于音频事件检测中用到的技术和算法可以以语音信号检测的框架和技术为基础。整个音频事件检测可以分为两部分,一是特征参数的提取,另一个是模式匹配和模型训练技术。对于特征参数,可以分为时域、频域和同态倒谱系数三大类。对于模式匹配算法,常用的有DTW、HMM、ANN等。接下来论述了VAD的基本原理和常用的经典算法以及异常声音识别系统的发展现状、所用到的技术以及系统的评价标准。然后对本文提出的基于谱相减法和新短时对数能量相结合的VAD算法进行了阐述,主要论述了谱相减法的原理和作用,新短时对数能量的改进思想和改进后的优势。并对新算法进行了matlab仿真和结果分析。对于异常声音识别系统,提出了利用时域特征参数和同态倒谱特征参数相结合的一种多级检测算法,本文中的异常声音针对的是枪声,对算法进行了C语言实现和结果分析。最后,本文对前面提出的算法进行了总结,并对接下来要做的工作和要解决的问题提出了自己的建议。
其他文献
本文研究主要定位于发展中国家的幼稚型资本密集型产业发展时的劳动密集型产业基础研究。资本密集型产业结构比劳动密集型产业结构的高度更高,具有为劳动密集型产业配套服务
自主学习是时代发展的需要,高中阶段是世界观、人生观、价值观形成的关键时期,这一时期学生自主学习能力的高低对个人今后的发展起着十分重要的作用。新课标明确提出学校教育要
网络电视的迅速兴起,不仅可能引发行业内的激烈竞争,改变行业的原有格局,更可能重新定义网络视频行业的发展模式。作为冲击原有网络视频行业的代表性力量,本文分析了CNTV的竞
云南省作为全国十大产煤省之一,为我国的发展做出了重要的能源支撑,但与此同时,云南省煤矿生产过程中的事故发生数和死亡率也遗憾的排在了全国较前面的位置。综合分析来看,云南所
<正>在今年3月的"两会"上,苏宁云商董事长张近东提出电商征税提案,在全国引发了一场大讨论。4月15日,发改委、财政部等13个部门联合发布的《关于进一步促进电子商务健康快速
随着利率市场化的推进,利率风险上升为银行的主要风险,利率风险管理成为商业银行风险管理的重点。利率风险度量是进行利率风险管理的基础,因此选择合适的利率风险度量模型具
随着社会经济的发展,交通的便利,影视、广播、网络的普及,香格里拉三坝纳西民族乡少数民族的视野不断开阔,交际范围不在局限于山高谷深的香格里拉少数民族地区,香格里拉三坝纳西民
本文依托天津市帅超激光有限公司,针对石油筛管的割缝加工,研发出一套在线自动检测系统,基于机器视觉图像处理技术,通过信息采集图像处理相机标定畸变校正以及信号同步等手段,最终
随着全球气候变暖,城市热岛效应已成为城市发展中不可逾越的话题。同时,城市热环境对人们的室外活动的影响也愈发重要,尤其是大学校园环境对学生生活学习活动的影响。本文针
改革开放以来,我国市场经济蓬勃发展,各种类型的商业建筑如雨后春笋般涌现。然而人们在享受高效便捷的购物消费和休闲娱乐的同时,商业综合体及其建筑群的巨大规模、多样功能、众