基于深度学习的声目标识别方法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:wanglx199085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为最常见的一种信息载体,声音中承载着丰富的类别信息,并且由于声学传感器具有隐蔽性好、价格低廉和不易受电磁干扰等优点,声目标识别对于安全监督、军事侦察、生态监测以及智能家居等领域都具有重大的意义。声目标识别过程分为特征提取和分类两个部分,现在主流的特征提取方法以人工提取为主,对个人经验依赖大。此外,基于传统的分类器难以对复杂的声音目标进行建模,无法解决复杂的分类问题。深度学习作为一种多层次的智能感知算法,能够充分挖掘目标的类别属性与深层特征。为此,本文提出将深度学习方法应用到声目标识别中,展开对声音特征提取与分类器设计的研究,以期为声目标的识别研究提供一种新的方法。本文以生活中常见的脚步声、雷声、钟声以及飞机声等非语音声目标为主要研究对象,使用音频文件作为数据集。本文在音频识别基本原理的基础上,设计了基于深度学习的声目标识别总体方案。首先,从梅尔滤波器设计和离散余弦变换两个方面出发设计了对数梅尔特征提取方法,该方法对声目标功率谱图经过一组高阶等高梅尔滤波器组后的输出取对数,得到的特征一方面隐含了人类的非线性听觉特性,另一方面加强了高频部分。其次,设计了一种多通道特征提取方法,用长度分别为512、1024和2048个采样点的窗来截取声信号,三种不同窗长的特征组合起来得到包含信息更为完整的多通道声特征。接着设计了用于深层特征提取的卷积神经网络模型和残差网络模型。最后设计了全局平均池化与深度神经网络相结合的分类模型,分析了一层全局平均池化层与不同结构的全连接神经网络组成的分类器的性能,全局平均池化分类器在保证识别准确率的情况下能减少训练参数。本文将数据集按照80%、10%和10%的比例分割成训练集、测试集和验证集三部分,以对数梅尔特征作为输入特征,基于不同窗长的多通道深层特征提取模型作为特征提取模型,全局平均池化层与两层直型深度神经网络作为分类器,对十类随机声目标在测试集上得到了90%的准确率,在验证集上得到了87.16%的识别精确率、85.00%的召回率和84.85%的F1值,本文所提方法对于随机声目标具有良好的识别效果。
其他文献
α-突触核蛋白(AS)是Lewy体的重要组成成分。AS基因定位于第4号染色体,其突变型与常染色体显性遗传性帕金森病(PD)的发病密切相关。在PD中,AS出现了折叠错误和排列混乱。AS的
针对远海伴随护航过程中舰载直升机巡逻警戒空域设置问题,在分析影响舰载直升机巡逻警戒空域设置因素及确定舰载直升机巡逻警戒方式的基础上,结合被护船只的数量和队形,从舰
大肠杆菌病是一种常见的人畜共患传染病,其在甘肃甘南也有流行。为分离鉴定甘南牦牛源大肠杆菌并探究其致病性,采集甘南牦牛新鲜腹泻粪便50份,进行营养琼脂培养基培养、选择
目的研究miR-34c对喉癌细胞株人喉癌表皮细胞(Hep-2)的细胞周期及细胞增殖的影响。方法将Hep-2分为转染miR-34c寡聚核苷酸组(A组)、转染无义序列组(B组)和空白对照组(C组)。
期刊
采用静电纺丝技术制备了PVAc纳米纤维膜,并进行氧气低温等离子后处理以提高该材料的润湿性能.使用扫描电子显微镜观察了等离子处理前后纤维形貌的变化,同时进行了纳米纤维膜
目的:观察云南白药贴敷加艾灸预防百白破疫苗注射所引起局部不良反应的效果。方法:根据幼儿家长的意愿,在幼儿接受百白破疫苗注射后,分别采用热水湿敷、云南白药贴敷加艾灸预防局
澧县土壤肥料工作站在县农科所建立省级土壤总肥力监测点,对洞庭湖区河湖沉积物土壤的基础肥力和主要耕作制度下不同施肥方法的作物产量及土壤肥力变化进行了连续6a的监测。结
社交网络的出现对于传统的媒体来说必然是一个很大的冲击,社交网络的发展不断深化、移动网络和数据的使用日益快捷、宽带速度明显提升,都是造成大数据时代对我们影响越来越深
间隔排队、间隔参与等操作不仅应该成为一种卫生习惯,还应成为一种文明习惯,即便在此次疫情结束之后,我们也有必要像保持口罩文明、打喷嚏文明、咳嗽文明、洗手文明、不乱吐
报纸
所有疾病都有一个发生发展的过程 ,近年来意识到对抗原的免疫应答也是具有可塑性的 ,动态的 ,不断扩展的过程。免疫应答从针对某抗原分子的一个表位到多个表位 ,从某种抗原到