基于卷积神经网络的异常音频事件检测的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：xzh_endless

【摘要】

：

音频信号作为生活中常见的蕴含特定信息的载体,已经成为人类获取信息以及传播信息最为有效的途径之一,因此被普遍的应用在生物医学、工业生产以及农业监管等领域中。伴随着经

【作者】

：

胡涛

【出处】

：

安徽大学

【发表日期】

：

2018年期

【关键词】

：

音频监控卷积神经网络异常音频事件检测声音特征维度数据增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

音频信号作为生活中常见的蕴含特定信息的载体,已经成为人类获取信息以及传播信息最为有效的途径之一,因此被普遍的应用在生物医学、工业生产以及农业监管等领域中。伴随着经济水平的日益提高,为了营造更为稳定和安全的社会环境,就需要构建成熟的立体化社会治安防范体系。监控系统则成为了保障和维护社会安全的重要手段,而传统的视频监控由于自身的局限性,其实际监控的性能往往并不理想,因而音频监控受到了极大的关注,充分利用音频信号中所携带的信息来辅助视频监控能够完善现有的监控体系。音频事件检测是音频监控的核心和关键。因为环境声音更加复杂多样化且混乱无规律性,传统的声学模型(支持向量机、高斯混合模型和隐马尔可夫模型等)由于缺乏建模能力,导致存在明显的缺陷。近年来,深度学习被成功的引入到音频事件检测领域中,有效的改善了检测的效果。因此,本文在对异常声音特性分析和公共场所的环境噪声进行建模的基础之上,对卷积神经网络在异常声音识别中的适用性及其识别性能进行了研究,并且针对网络模型的维度变化在噪声鲁棒性以及误差收敛速度等方面的影响进行了详细的比较。文中主要开展的工作内容如下:(1)公共场所的声学环境下音频信号前端处理算法研究。通过对公共场所的环境噪声成分进行分析,得出该声学环境下噪声的分布特点和时频特性,并对公共场所下噪声和异常声音的混合方式进行建模。在此基础上分别确定了音频信号的端点检测算法以及声音去噪算法。在声音去噪的部分,对适用于公共场所下的基于改进的自适应滤波器的异常声音去噪方法进行了研究,通过实验表明,该方法能够有效的抑制噪声,即便在低信噪比下去噪效果仍然十分显著。在端点检测的部分,实验性的分析了基于短时能量和过零率的双门限法与基于自适应子带谱熵法两种端点检测方法,得出自适应子带谱熵法在噪声环境下具有更好的稳定性与准确性。(2)具有良好标注的训练数据相对稀缺问题的解决方法的研究。获得高效准确的声学模型需要庞大的训练数据来支撑。由于训练数据资源匮乏,使得声学模型研究受到了极大的限制,本文提出了通过数据增强方法来解决带标签的异常声音样本稀缺的问题,在保证样本标签的实际含义不发生改变的前提下,通过多种方式进行适当转换从已有的训练样本中扩增出新的数据。采用数据增强之后的训练样本进行学习的声学模型对未知因素具有更好的鲁棒性和泛化能力,能够在公共场所这种复杂环境下进行更好的推广。(3)基于卷积神经网络的异常声音识别的研究。通过和高斯混合模型、BP神经网络进行比较,分析和验证了卷积神经网络在异常声音识别任务中的适用性及其识别性能。同时针对音频信号的一维特征对卷积神经网络的结构进行变化和调整,将其与传统的卷积神经网络在识别能力、噪声鲁棒性和误差收敛速度等方面进行比较。实验结果表明,经过简化的卷积神经网络在误差收敛速度方面优于传统卷积神经网络;在识别性能方面,当处于噪声干扰强度大的环境下,传统卷积神经网络性能较好,但是噪声干扰强度小的环境下,适用于一维特征的卷积神经网络性能则优于传统卷积神经网络。(4)基于卷积神经网络的异常音频事件检测系统的研究和实现。在对音频信号前端处理以及音频事件检测算法研究和归纳的基础之上,实现了根据噪声估计来匹配合适的卷积神经网络模型结构的异常音频事件检测系统,该系统在Matlab平台下进行开发,主要具有音频事件检测功能,同时还提供了音频采集和输入、前端处理、模型训练等相关功能模块。在实际测试过程中,该系统具有良好的识别效果。

其他文献

探析新课程下中学英语互动式教学模式

新课程的核心理念是以学生发展为本，激发学生学习兴趣，积极主动参与教学活动，并从中获得知识。这也势必要求对中学英语的传统教学模式进行改革。本文就新课程背景下的高中英语采

期刊

新课程互动式教学方法

激光焊接工艺参数对低碳钢焊缝形状的影响

采用3HE-MF300W四轴联动激光焊接机对Q195低碳钢进行激光焊接实验,利用金相法研究焊接工艺参数对焊缝熔深和熔宽的影响。结果表明焊接速度和离焦量一定时,随激光功率由30W增

期刊

低碳钢激光焊接熔深熔宽

具有反爬虫机制的影评系统的设计与实现

随着电影业的不断发展,越来越多的电影涌现在人们的面前,人们想甄选出较好的电影,通常是以电影的综合评价作为首要标准,此时全面、客观的评价就显得尤为重要了。最早的电影评价是在传统的纸媒上进行的,通常都是由专业影评人发表影评文章,但这种评价方式手段太单一,而且不能够从多维度对电影进行评价,容易对观影人产生误导作用,所以全民参与影评的需求就显得尤为突出。随着互联网的高速发展,人们可以在网络上对所有的电影进

学位

反爬虫极端梯度提升算法微服务高可用

优化农业生态建设政策体系加快美丽中国建设步伐

<正>做好财政支持农业生态建设工作,要全面贯彻落实党的十九大精神和习近平新时代中国特色社会主义思想,以社会主义生态文明观和实施乡村振兴战略为指引,总结经验,锐意进取,

期刊

农业生态建设乡村振兴战略党的十九大精神社会主义生态文明观重点国有林区美丽中国建设

自制教具,发展自我效能感——“分层走班教学”模式下初中生物教学准备的点滴思考

学生具有明显的个体差异,激发师生自我效能感必须从教学准备开始,自制教具、学具能够给学生眼前一亮的感觉,继而激发学生生物学习兴趣,驱动学生的学习向促进认知、能力和素养

期刊

教具自我效能感教学准备

高中物理概念课堂教学观测量表的构建与实践研究

基于建构主义学习、教学理论以及课堂观察LICC范式,构建了高中物理课堂概念教学观测量表,采用两两比较法对各评价指标的权重进行了赋值,运用所构建的课堂观测量表对高中物理

期刊

物理概念课堂教学观测量表

三种不同土工格栅在土木工程中的应用

对塑料土工格栅、经编土工格栅和玻纤土工格栅的不同性能进行比较,并介绍了三种土工格栅的适用范围.

期刊

土工合成材料加筋软基

独立董事特征对上市公司会计信息披露质量影响的实证研究

为了确保上市公司运行规范,增强董事会对管理层的监管,提升董事会的独立性,进一步维护中小股东的合法权益,我国于本世纪初引进了独立董事制度。这一制度的引入使得证监会和广大投资者将保护中小股东利益的愿望寄予在独立董事身上,但该愿望并没有得到很好的实现。从独立董事制度引入我国到现在,我国上市公司会计信息披露的质量虽出现好的转变,但不客观、不真实、不及时甚至舞弊等情况仍屡见不鲜。因此,本文将委托代理理论、信

学位

独立董事独立董事特征会计信息披露质量

基于某电信运营商的LTE网络规划研究

移动通信的发展日新月异,其已成为现代人日常生活中不可或缺的重要组成部分。经过30年的发展,目前已经发展到第四代移动通信技术。LTE(Long Term Evolution)作为3GPP确定的主

学位

LTE网络规划仿真优化

抗心肌纤维化药物研究进展

病毒性心肌炎所致的心肌纤维化近年来日益受到国内外心血管病专家的重视。目前现代医学对其确切的发病机制尚未完全阐明，对其各个发病环节虽有多种防治手段，总体效果却有待进一

期刊

心肌纤维化病毒性心肌炎中医药研究中西医结合综述

基于卷积神经网络的异常音频事件检测的研究

与本文相关的学术论文