城市噪声分类检测系统研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:mnwang2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相比语音和音乐信号,城市噪声作为声音信号的一种类型,具有复杂多变的特性。近年来,基于深度学习技术的城市噪声分类成为研究热点,目前最多的改进研究是基于特征提取的改进与基于分类网络模型的改进。由于环境声音信号在时序上的信息关联度相比语音信号较弱,因此对于循环神经网络(Recurrent Neural Network,RNN)、门循环单元(Gate Recurrent Unit,GRU)、长短期记忆网络(Long Short Term Memory,LSTM)这些具有时序信息的网络,卷积神经网络(Convolutional Neural Network,CNN)在环境声音分类中仍占主导地位。采用端到端的分类方法会使原始音频信号送入神经网络训练时产生较多的噪声分量信息,因此仍以人工设计的特征提取为主,同时集成方法和数据增强仍为声音分类的主流。基于此,本文进行了如下研究:(1)基于差异分辨率的多通道特征融合(Multi-Channel Feature Fusion with Different Resolution,MCFF-DR)与单一分辨率的单通道特征融合(Single Channel Feature Fusion with Single Resolution,SCFF-SR)算法。本文首先对梅尔频率倒谱特征(Mel-Frequency Ceptral Coefficients,MFCC)特征进行改进,使用离散小波变换(Discrete wavelet transform,DWT)替代离散余弦变换(Discrete cosine transform,DCT),缓解了原始音频中有用信息的缺失。接着,针对不同环境声音对不同时间尺度灵敏度不同的问题,提出了MCFF-DR方法,对五种音频特征进行改进,利用不同的滤波器组产生分辨率不同的特征,在频率维度上进行拼接融合,并在多通道上对多种特征进行融合,得到LM-CS-CQT与IMF-GF-CS-CQT特征。另外将7种音频特征利用本文提出的SCFF-SR方法进行融合,得到LMCST与IMGFCST特征。实验发现,本文所提融合特征具有较强鲁棒性,适于表征外界环境中的音频信号。(2)基于双二流卷积的D-S声音检测研究。本文首先提出随机倒放填充法来进行数据增强处理,使用音频填充与倒放操作增加了原始环境声音的有用信息且保证了音频序列长度的一致性;然后,提出了双二流卷积网络结构用于声音分类。第一流和第二流网络采用MCFF-DR特征法送入二阶密集卷积网络(two-Dense Convolutional Network,2-Dense Net),其中2-Dense Net被分成了2个密集块。第三流和第四流网络采用SCFF-SR特征法送入4层CNN网络。然后利用D-S证据理论对softmax层的输出结果进行融合,得到D-S-Net模型。在Urban Sound8k数据集下得到96.36%的分类精度,较基线提高了25.34%。(3)构建了城市噪声分类检测系统。本文首先提出了基于小波包分解的拉普拉斯生成对抗网络(Wavelet packet decomposition-Laplace Generative Adversarial Network,WPD-LAPGAN)的环境声音增强去噪,通过自适应小波包分解求其背景噪声后送入LAPGAN中进行声音增强;使用倒谱距离、改进的Teager能量距离与短时过零率三种特征的融合并结合频谱质心距离特征进行起止点环境声音事件的定位;并提出重叠声音事件的检测方法,利用谱图规律与补频进行重叠区域声音事件的重构。通过实验验证,本文提出的声音增强算法、起止点声音定位算法与重叠声音检测方法均得到了良好的效果。
其他文献
随着生物医疗、光通信、食品安全等产业的不断发展,AlGaN基深紫外发光二极管(deep-ultraviolet light-emitting diodes,DUV LEDs)因具有芯片尺寸小,驱动电压低、环境污染小等优势而备受关注。同时,目前已有科学研究表明,深紫外LED对细菌病毒有很好的灭杀效果,然而目前深紫外LED的外量子效率(external quantum efficiency,EQE)非
学位
报纸
当集成电路技术节点已经缩小至7 nm及以下时,金属Cu作为互连线因严重的电迁移问题已不能满足集成电路的发展需求。Co因具有更小的电子平均自由程、更强的抗电迁移特性、高中横比中良好的共形沉积等特性而被认为是替代Cu作为互连线的最有前景的金属材料。然而,Co互连在粗抛过程中获得较高去除速率的同时表面容易发生腐蚀,且国内外多集中于Co平面的研究,对Co高低差的平坦化鲜有报道。因此,本文针对Co互连粗抛过
学位
硅通孔(TSV)技术,可以获得更好的集成电路兼容性和互连密度,使芯片的堆叠不再局限于面板级别,实现了2.5D/3D互连。但是相较于铜大马士革布线工艺,硅通孔铜镀层厚度可达到十几微米,需要更快的平坦化技术。研究硅通孔正面化学机械抛光(CMP)高速去除铜覆盖层、有效抑制碟形坑的生成以及表面质量的改善,是后续获得合格芯片的关键。本论文对碱性TSV铜层抛光液进行研究,主要目标是实现TSV铜层的高去除速率和
学位
随着世界工业技术的不断进步和发展,以集成电路制造为基础的传统半导体产业成为推动其发展不可或缺的重要基石。其中,二氧化硅(SiO2)常作为栅极氧化层、牺牲层、绝缘层和层间介质材料被广泛用于集成电路(IC)芯片的制造过程之中。化学机械抛光(CMP)通过统合机械磨削和化学作用,成为工业生产中可兼顾晶圆全局和局部平坦化的唯一技术。目前,随着器件尺寸逐渐接近原子和分子尺度,在保证表面形貌质量的前提下,实现层
学位
钠离子电池(SIBs)因资源丰富、环境友好和成本低等优势有希望应用于大规模电网储能领域。正极材料是钠离子电池的重要组成部分之一,决定其能量密度、功率密度和循环寿命。因此,开发高性能的正极材料是推动SIBs商业化的关键。正极材料中锰基层状过渡金属(TM)氧化物因具有合成方法简单、结构可调控性强和理论比容量高等优点得到广泛研究。然而,在充放电过程中,Na+/空位有序重排引起的扩散能垒会严重阻碍Na+的
学位
随着半导体产业的发展,集成电路早已进入极大规模集成电路(GLSI)时代。目前,芯片关键技术节点已经发展到5 nm以下,传统制程工艺中用到的钽和氮化钽(Ta/Ta N)阻挡层材料已难以满足集成电路(IC)发展的需求。为实现特征尺寸在5 nm以下的芯片制程,金属钌(Ru)凭借其台阶覆盖率高、电阻率小、稳定性好等优点被选为未来最具潜力的阻挡层材料。目前国内外基于铜互连钌基阻挡层CMP的研究较少,且大多数
学位
近年来,具有独特发光特性的钙钛矿材料,引起了研究领域和商业领域的极大关注。目前大多数关于钙钛矿发光二极管(Pe LEDs)中钙钛矿薄膜的制备主要采用溶液法,热蒸镀法是近几年才开始应用于制备钙钛矿薄膜。现在热蒸镀法制备出的器件性能还远达不到溶液法制备的器件,而界面修饰策略已被证实是改善Pe LEDs器件性能的有效策略,因此本论文以全无机钙钛矿Cs Pb Br3为研究对象,主要探究了双界面修饰策略对基
学位
新型冠状病毒感染症(SARS-Co V-2)的迅速传播导致了新型冠状病毒感染症(COVID-19)的全球流行。全世界都十分关注这一事件的发展,对于各国政府来说,迅速有效地识别COVID-19阳性患者至关重要。目前有许多可用的分子检测方法,但并不是所有医院都能立即采用这些方法。对于缺乏分子检测的医院来说,另一种通过CT扫描诊断COVID-19的方法更为适用。然而,COVID-19与其他病毒性肺炎在C
学位
前列腺癌是男性第二常见的恶性肿瘤,仅次于肺癌,在发达国家的发病率更高。前列腺癌早期可能无症状,病程缓慢,只有在癌症进展时才会出现症状。因此,如果早发现、早诊断、早治疗,治愈率可以大大提高。前列腺癌的诊断和治疗主要采用MRI图像检测技术,其中许多问题包括腹部MRI中前列腺的准确性和自动分割,这对临床应用至关重要。目前,大多数现有的前列腺分割方法都是通过一系列的程序进行的,每一步都需要手动经验参数调整
学位