基于深度学习的无监督机器异常声音检测方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:szscan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器异常声音检测是对现实工厂中的工业机器进行音频监控。它通过其运行时发出的声音的变化情况,从而进一步判断机器存在故障的技术。该项技术在安全监控、工业生产、故障诊断等领域都有着广阔的应用前景。近年来,随着现实工业场景中对提高安全性的需求,声音作为识别事件的关键因素之一。机器异常声音检测已经获得了越来越多的研究者关注。现阶段,机器异常声音检测的研究领域可以分为基于深度自动编码器和基于轻量化卷积神经网络两个研究方向。本文主要围绕这两个研究方向展开叙述,首先阐述了基于深度学习的机器异常声音检测的理论体系,主要包括音频特征提取流程、机器异常声音检测数据集以及机器异常声音检测所用到的深度学习算法。然后介绍了基于深度自动编码器方法的基线系统,并实现了基于记忆增强的深度自动编码器的机器异常声音检测模型,使用该模型对机器运行声音数据集进行检测,将实验结果与使用基于深度自动编码器的基线系统的实验结果进行比较。随后,在机器异常声音检测任务中,本文着眼于基于轻量化卷积神经网络的机器异常声音检测方法,并通过使用目前最具有代表性的轻量化卷积神经网络搭建模型进行机器异常声音检测任务。论文的主要研究内容包括:(1)机器异常声音基本检测流程。详细介绍了音频特征提取流程、机器异常声音检测数据集以及两种机器异常声音检测的深度学习方法。本文选择对数梅尔频谱作为声学特征,提取音频特征的流程包括预加重、分帧加窗、短时傅里叶变换、三角滤波、取对数。机器异常声音检测数据集使用的是2020年DCASE机器异常检测挑战任务的数据集,共包含玩具车、运输机、阀、泵、风扇和传送带这六种机器运行时的声音。最后介绍了深度自动编码器与轻量化卷积神经网络这两种机器异常声音检测的深度学习方法。(2)提出了一种具有记忆功能的深度自动编码器对机器异常声音检测。记忆增强的深度自动编码器能够在训练过程中诱导记忆模块来存储机器正常声音数据。在测试过程中,记忆增强的深度自动编码器并不将机器声音数据的编码直接提供给解码器,而是将其作为查询来检索内存中最相关的项目,然后聚合并传递给解码器,该过程从编码中删除异常信息,从而防止强解码器重构异常。首先介绍了记忆增强的深度自动编码器的基本思想,然后对基于深度自动编码器的机器异常声音检测方法的模型、算法理论等进行了介绍,并对基于深度自动编码器方法的基线系统和实验结果的评价指标进行了阐述。随后从编码模块、记忆模块、解码模块三个模块的架构和功能对记忆增强深度自动编码器的结构进行了介绍。最后将基于深度自动编码器的基线系统与构建的基于记忆增强深度自动编码器对机器异常声音检测任务进行实验比较,实验结果表明在机器异常声音检测的任务中,使用基于记忆增强深度自动编码器明显优于基线系统。(3)设计了一种基于轻量化卷积神经网络的机器异常声音检测方法。因为机器异常声音检测的任务是为了通过训练神经网络得到一个机器异常声音检测系统,使用该系统对工厂中的机器进行实时监测,这意味着最终的机器异常声音检测系统将搭建在一个移动设备或者嵌入式设备的平台上运行。轻量化卷积神经网络推动了深度学习技术在移动端,嵌入式端的应用落地,满足了机器异常声音检测任务的应用需求。首先从原理、模型和应用几个方面介绍了轻量化卷积神经网络算法的理论基础,然后分别介绍了基本的卷积神经网络模型和一个具有代表性的轻量化卷积神经网络模型MobileNet,并且与普通的深度卷积神经网络做了一个对比,最后对基于MobileNetV2的机器异常声音检测方法进行实验,特征提取、模型训练以及网络结构的设计,并且将实验结果与基于深度自动编码器机器异常声音的结果做对比进行分析,实验结果表明在风扇和阀门这两种机器上使用轻量化卷积神经网络模型相对于基于深度自动编码器在机器异常声音检测任务中效果有一定程度的提升。
其他文献
联邦学习允许多个客户端在不共享数据的情况下,协作地训练一个全局模型,为客户端提供了基本的隐私保护。然而,在联邦学习中,恶意的客户端可能执行投毒攻击,导致全局模型不可用或存在后门;也可能执行推理攻击,获取其他客户端的隐私数据。针对上述两类攻击,本文对联邦学习中投毒与推理攻击的防御方法展开研究。主要研究内容如下:(1)提出两种针对投毒攻击的防御机制:基于阈值的异常更新值去除机制(Threshold-B
学位
随着科技的发展,人们的日常生活方式得到了改善,科技在给予人们方便的同时,也对信息安全造成威胁。譬如数据泄露、假冒信息等现象在社会上层出不穷,保障信息安全成了时下亟需解决的问题之一。可逆信息隐藏技术(Reversible Data Hiding,RDH)将秘密信息嵌入到载体图像中得到载密图像并传输给接收方,整个过程不被中间方所察觉,接收方可以凭借密钥从载密图像中完整地提取出秘密信息,并将载密图像恢复
学位
龙葵(Solanum nigrum L.)全草均可入药。本研究采用UHPLC-Q Exactive高分辨质谱结合GNPS分子网络(global natural products social molecular networking),对龙葵叶的化学成分进行快速表征。通过与文献报道数据比较,并结合质谱裂解特征规律分析,以及GNPS分子网络中已知和未知节点的关联分析,从龙葵叶中共鉴定157个化合物,
期刊
颅内血肿是颅脑损伤中常见且严重的继发性疾病,会使患者产生意识障碍、脑疝等症状,严重影响患者的生活甚至威胁患者的生命。因此,对颅内血肿的早期识别和处理,是为病人争取最好治疗效果的有效诊断和治疗前提。然而,人工识别颅内血肿效率较低,严重影响病人的治疗进程,耽误最佳治疗时机。随着科技的发展,利用计算机辅助医生诊断的方式逐渐被公众认可,其中深度学习凭借其在各个领域的突出表现,也逐渐被应用到医学影像领域并被
学位
随着社会经济的迅速发展,网络信息化和大数据时代的到来,日益扩大膨胀的信息和数据在人们的生活的方方面面随处可见。游者们为了高效和准确地获取信息,搜索引擎成为了旅游日常获取目的相关信息不可或缺的工具。当前,众多学者对旅游需求预测的研究主要是通过构建复杂的预测模型来提高预测模型的预测性能。而这种预测模型大部分存在着模型过拟合,很难精确地提高预测模型的预测性能。事实上,将影响旅游需求的多种不同因素引入旅游
学位
开展复合材料壳体承载能力预示和评估,是固体火箭发动机设计的重要内容,也是新型高速导弹发动机工程研制过程中亟需解决的难题之一。新型高速导弹飞行过程中,与空气摩擦产生的气动热使弹体表面产生1000℃以上的高温,导致复合材料壳体的强度和刚度大大降低,严重影响其承载能力。本文通过理论分析、数值仿真和试验验证,系统研究了裙粘接结构承载能力,以及高温下复合材料壳体内压、轴压、外压承载能力,形成了适用于工程应用
学位
作为数字媒体安全重要技术之一,可逆信息隐藏在篡改定位、完整性认证等需要保护载体内容的场景中有着广泛的应用。在各种图像格式中,JPEG图像是当今最流行的图像格式。因此,基于JPEG图像的可逆信息隐藏具有重要的研究价值。目前JPEG图像可逆信息隐藏主要分为两大类,即基于变换域和基于编码域修改的算法。基于编码域修改的算法主要通过编码映射方式嵌入信息。然而,基于编码映射的算法存在嵌入容量有限和适用性不足的
学位
作为一种数据预处理技术,实例选择(Instance Selection IS)旨在选择少量具有相同(甚至更高)分类能力的实例子集。由于其广泛的应用,人们提出了许多具有良好性能的IS算法。然而,大多数现有算法侧重于利用不同的优化技术来设计新的IS算法,而很少有人考虑IS的实际应用情况。例如,在多类别情况下,实例选择问题更加复杂,不同类之间的不平衡性对现有的IS算法提出了很大的挑战,目前基于进化算法的
学位
由于视频监控和智能安防的普及,视觉跟踪的应用领域越来越广,视觉跟踪成为了计算机视觉中的一个重要研究方向。而可见光与热红外图像可以相互补充,已被证明是提高跟踪性能的有效方法。因此,结合可见光与热红外信息的RGBT视觉跟踪引起了人们的广泛关注。然而现有的RGBT视觉跟踪网络结构大多是人类手工设计的,严重依赖于专家经验和科学直觉,且无法保证结构的最优性。本文针对这个问题展开研究,分别提出两种神经结构搜索
学位
随着全面小康社会的建成、人民的经济水平日渐提高,车辆的普及率越来越高,为城市管理、交通安防建设带来了难题。车辆重识别作为智慧城市最重要的课题之一,它的主要任务在于,给定特定的车辆图像,在复杂的监控网络拍摄得到的海量数据中检索并定位到该车辆。作为非常具有实际意义的一门课题,我们在研究中发现阻碍车辆重识别发展最主要的两个问题:(1)针对车辆重识别数据标注困难、车辆的极端视角变化导致无监督聚类算法不能很
学位