基于卷积神经网络的声学场景分类研究

来源 :安徽大学 | 被引量 : 2次 | 上传用户:purong0826
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学场景分类任务是将输入的音频分类成一个预先定义的声学场景的类,其目的是通过机器来模拟人类分辨声学场景的能力。目前声学场景分类技术在生态环境监测、公共安全智能化监控、语音识别技术、自动化辅助驾驶等多个领域都有应用,这也使声学场景分类任务成为人工智能发展的重要领域。近几年来,深度学习技术已经广泛应用于人工智能的各个领域,卷积神经网络也逐渐成为最受欢迎的声学场景分类方法。本文主要研究了在声学场景分类问题中不同的卷积神经网络架构对分类结果的影响,并在此基础上,提出了一种将声学场景分类与声音事件检测(主辅任务)相结合的多任务学习方法。本文的主要的工作有以下两个方面:(1)研究了面向声学场景分类的卷积神经网络模型构建的方法。由于声学场景分类任务的特殊性,深层结构的卷积神经网络并不能获得很好的效果。本文针对声学场景分类问题,从卷积神经网络的一般架构入手,通过对卷积层数、过渡层以及网络架构类型的调整来对声学场景分类问题进行研究。最终,我们构建出的模型在TUT acoustic scene 2017数据集上进行广泛的实验,相较于DCASE2017基线系统,我们构建的模型在分类准确率上有明显的提升。(2)提出一种基于多任务卷积神经网络的声学场景分类方法。由于声学场景分类任务的特殊性和数据集的限制,很难通过设计模型架构来继续提高准确率。为此,本文提出了利用声学场景和声音事件的相关性,将声学场景分类与声音事件检测(主辅任务)相结合联合训练的多任务学习方法。实验结果表明,基于多任务学习的卷积神经网络模型在声学场景分类问题上,比基于单个任务的卷积神经网络模型分类准确率有一定的提升。声音事件检测的分段错误率相比与基线系统有所上升,但F-score的准确率有提升。该实验结果验证了我们所提出方法的有效性。
其他文献
我国风力资源的分布大部分远离负荷相对集中区域,风电的大规模远距离输送成为了避免资源浪费,进行资源合理优化配置的重要方式。为了提高输电线路的远距离输送能力,提高输电
指纹形态学特征是研究指纹识别系统的重要依据。基于形态学的指纹特征提取算法只能提取单一特征,获取多种特征需要组合多种不同算法。能否通过一种算法同时提取指纹的多种特
研究目的:观察MRL/lpr狼疮鼠外周血、骨髓及髓外造血生成情况;MRL/lpr狼疮鼠和C57BL/6小鼠骨髓成骨细胞(osteoblasts,OB)表面的粘附分子N-Cadherin表达水平差异及对造血干细胞分化的影响;观察同种异体BMMSCs(bone marrow masenchymal stem cells,BMMSCs)静脉输注对MRL/lpr狼疮鼠造血的影响。方法:(1)通过血细胞分析
为了改善大气环境,应用于新能源开发领域的变换器是一种真正意义的“绿色环保”电能变换器。根据变换器输出特性的不同,可以分为电压源变换器(Voltage Source Converter,VSC)和电流源变换器(Current Source Converter,CSC)。其中,由于电流源变换器具有较宽的输出电压范围、直接控制输出电流、内在的短路保护能力及动态响应快等优点,主要应用于交通运输领域的电动汽
随着信息化进程的加快,人们更倾向于以图像作为载体快速高效的获取信息,这就对图像的采集、传输、存储提出更高的要求,特别是在亮度分布不均匀的自然环境中,高反光物体成像时
本研究对采自吉林、辽宁两省主要稻区的154份初侵源样品,田间耕作层土壤、病残体(土壤耕作层)、病稻草、种子进行相关处理,并通过利用PCR技术分别对水稻白叶枯病、水稻细菌性条斑病、水稻细菌性谷枯病和水稻细菌性基腐病的初侵染源进行相应病原菌的检测。明确种子、土壤、病残体、为吉林、辽宁两省主要稻区细菌性病害的初侵染源。其中,出现阳性条带的样品如下:吉林省白城市1份土壤样品、吉林省四平市共6份种子样品、吉
研究目的:对我国男子轻量级运动员的挺举技术参数进行现场采集并通过大样本量的统计学研究,试图建立我国男子轻量级举重运动员挺举技术的综合评价模式。分析优秀运动员的挺举
基因组印迹(Genomic imprinting)是一种表观遗传(Epigenetic)现象,是指哺乳动物的一少部分基因优先表达来自父系或者母系的等位基因。印迹基因在哺乳动物的生长发育和胎盘功能中起着重要的作用,印迹基因表达紊乱常伴随疾病的发生。牛由于具有实验动物(如啮齿动物)所不具备的诸多优势,成为后基因组时代人类疾病研究的新型模式生物。目前,印记研究主要集中在人和小鼠中,而牛中被鉴定的印记基因
复杂网络的应用研究在近几年被拓展在越来越多的领域,由最初规模庞大的基电网络,金融网络和航空网络,到近期的互联网社区网络等,都得到各界研究人员们的关注。而复杂网络中,
近年来,中锰TRIP钢因其优异的性能和较低的成本,成为最具有发展潜力的第三代先进高强汽车用钢。因此,进一步提高中锰TRIP钢的综合力学性能成为学者们的主要研究方向。为提高中锰TRIP钢的强度,常在钢中添加磷元素以达到固溶强化的效果,然而磷在固溶强化的同时,又很容易在晶界偏聚,从而增加中锰TRIP钢的脆性。因此,有必要对中锰TRIP钢中磷的偏聚行为进行研究。本文以铌含量不同的热轧0.2C-5Mn钢(