【摘 要】
:
声音是人类感知周围环境的主要途径之一,声音传播的全向性以及不受光线和角度影响的优点使得人类能够利用该途径进行有效地感知和决策。而环境声事件识别技术的目的是探究一种让机器来自动化感知周围声环境并做出相应决策的方法。自上个世纪七八十年代以来,相关领域的科研人员着手研究环境声的感知和识别并取得了一定进展。近几年,CLEAR和DCASE等声音事件识别和检测类的国际竞赛也相继展开,从而推动了环境声事件识别领
【基金项目】
:
广西重点研发计划-城市环境音的智能感知和大数据处理项目(No.2017AB08072);
论文部分内容阅读
声音是人类感知周围环境的主要途径之一,声音传播的全向性以及不受光线和角度影响的优点使得人类能够利用该途径进行有效地感知和决策。而环境声事件识别技术的目的是探究一种让机器来自动化感知周围声环境并做出相应决策的方法。自上个世纪七八十年代以来,相关领域的科研人员着手研究环境声的感知和识别并取得了一定进展。近几年,CLEAR和DCASE等声音事件识别和检测类的国际竞赛也相继展开,从而推动了环境声事件识别领域的飞速发展。尽管在该领域已有大量的研究成果,但目前仍存在许多问题还未得到很好的解决,例如(i)对特征融合相关的研究不足,例如存在基于前融合的特征融合方式不利于卷积神经网络提取高阶特征的问题;(ii)由于本领域内的研究主要落足于对理论方面的研究,例如对声学特征和分类算法的研究,而与工程应用相关的研究不足,例如对连续声音数据流的检测、对环境声数据集的扩增以及对不同采样频率的声音对识别的影响等问题。针对上述问题提出如下解决方案。(i)在特征融合的研究中,针对前融合的特征融合方式不利于卷积神经网络提取高阶特征的问题,提出一种基于双输入卷积神经网络的特征融合框架。该特征融合框架将两种声学特征分别经过不同的卷积和池化策略进行高阶特征提取,然后将高阶特征进行拼接并送入输出层输出分类结果。这种方式不仅为不同的特征匹配合适的卷积和池化策略,还避免了单位或尺度不同的特征拼接在一起干扰卷积核的高阶特征提取能力。经公开数据集的评估结果显示,本文提出的特征融合方法相比单一特征和现有的融合方式性能更优。而且,将此框架应用于实际场景下对汽车鸣笛声的检测识别,结果显示,查全率达到87.7%,查准率达到84.7%,F1度量达到86.2%,优于其他方法,验证了该方法在实际应用中的可行性。(ii)在工程应用研究中,将理论联系实际,将环境声事件识别算法部署到实际场景中,并针对遇到的一些困难,提出了合理的解决方案,例如针对连续的长段声音数据的检测问题,提出一种基于滑动检测思想的环境声事件检测方法,该检测方法包括声音数据的预处理、声学特征提取、分类器建模和识别、分类结果整理等。该系统适用于检测连续的长段声音数据中存在的环境声事件,经实景测试,本系统可嵌入不同的环境声识别方法而且具有较好的检测性能。针对训练所用的环境声数据量不足的问题,使用与同门开发的环境声采集设备收集了大量环境声数据,并使用数据增强技术扩增了环境声数据集,提升了环境声识别方法的泛化能力。针对高保真的声音数据导致网络传输压力大的问题,通过理论分析以及实验研究,确定了合适的声音采样频率,大大降低了网络传输压力。最终将环境声事件识别算法落地于校园场景,有效地提升了校园的安防能力。
其他文献
近年来,各种大型建筑物越来越多,如城区高楼的搭建,各类大桥的建设,水库大坝的新建等等,都给我们的生活带来了很大的便利。与此同时,开展建筑物的全面安全监测关乎居住的每个人的生命财产安全,保障这些建筑物的正常运行具有重要的现实意义。因此,新型的形变监测方法-地基合成孔径雷达(ground-based synthetic aperture radar,GB-SAR)成为研究热点,本论文也对此开展研究。G
面内馈源反射面天线是为解决传统反射面天线高剖面结构不利于其集成化与小型化的问题,而提出的一种基于相位梯度超表面实现的新型超表面天线。相对于传统反射面天线来说,面内馈源反射面天线具有极低的剖面,非常适合与平板电路搭配使用,而且其设计复杂度、制造难度以及实现成本都远低于传统反射面天线。因此研究面内馈源反射面天线有重要的现实意义和潜在的应用价值。本文在面内馈源反射面天线的基础上,结合现代通信系统对高性能
车载毫米波雷达用于保障驾驶安全在国内外汽车安全领域已达成共识。作为智能驾驶技术的重要传感器,其有助于在保证车辆安全的前提下给予驾驶员更好的身心体验,提高驾驶乐趣。本文针对车载雷达天线的特点,使用基片集成波导(Substrate Integrated Waveguide,SIW)结构研究并设计了77 GHz毫米波车载角雷达天线,同时设计了77 GHz车载前向雷达阵列天线。最后利用微波单片集成芯片(M
太赫兹滤波器是工作于太赫兹频段的频率选择器件,能够在通带内提供信号输出并在阻带内提供衰减,能有效地消除噪声干扰,提高信噪比。太赫兹滤波器是一种十分关键的太赫兹功能器件,对太赫兹技术的发展有巨大推动作用。可调太赫兹滤波器因其强大的动态调制性能,逐渐成为太赫兹领域的研究热点。本学位论文是基于超材料的电触发式可调太赫兹多带通滤波器的研究,对可调太赫兹多带通滤波器的静态滤波特性和动态调制响应的物理机理作了
目标检测技术一直是计算机视觉领域当中比较热门的研究方向,目标检测技术在民用与军用领域都有着极其广泛的应用。移动智能体,指的是具有一定硬件计算能力的实体。民用领域的移动智能体主要包括移动机器人、无人驾驶车辆、无人机等载体,面向民用智能体的目标检测应用场景包括自然场景下的物体检测、行人检测等。军用领域的移动智能体主要包括卫星、导弹等,军用智能体的目标检测应用场景包括面向卫星的遥感图像中的目标检测、机载
当前,脑卒中成为继心脏病及癌症后第三大死亡原因,严重威胁了人类生命健康。临床表明,早诊断、早发现、早治疗可降低患者死亡率。近年来,随着计算机技术和医学影像技术的发展,计算机辅助诊断(CAD)成为医学诊断中的研究热点。CAD不仅减轻了医生的工作负担,还提高了脑卒中神经功能缺损程度的诊断效率。本文对脑卒中磁共振成像(MRI)病灶图像的CAD关键技术进行了研究,具体内容如下:1.针对卒中病灶对比度低、形
回流焊工艺是保证焊点可靠性的最重要的环节之一。目前,主流的回流焊工艺研究有三种方式:基于实验试错法、数理统计和虚拟仿真。前两种方式会花费大量的时间和物力,因此,回流焊工艺温度曲线虚拟仿真的省时省力的优势愈加突出,逐渐成为理论上指导回流焊工艺参数制定的最直接有效的方法。但是由于表面组装印制电路板PCBA以及回流炉的结构复杂,详细建模会导致仿真时间过长,效率得不到保障。而现阶段的简化,精确度又不足以指
纳米薄膜广泛应用于半导体材料表面改性及防护,目前磁控溅射法是制备纳米薄膜的主要方法。由于受随机因素影响磁控溅射生成的膜厚存在误差,开发纳米级膜厚在线检测系统,实时调节工艺参数,是提高同类设备精度及效率的技术瓶颈。运用零件平面度检测法和统计学原理作为薄膜厚度在线检测系统的理论基础;综合运用机电一体化集成技术,完成在线检测系统的开发。实施的过程主要包括:(1)学习机械设计、数理统计、设备智能控制等课题
随着互联网时代向人工智能时代的过渡,现代化的教育也越发趋于智能化,人工智能+教育的方式成为未来教育的发展趋势。大数据环境下的人工智能教育具有个性化、精准化以及全面化等特点,在减轻教师教学负担的同时,极大地提高了学生的学习收益,促进了教育技术的变革。知识追踪作为一种对学习者知识水平进行建模的方法,在智能教学系统中起着关键作用,对其研究是促进教育发展的重要手段之一,具有重要的研究意义和社会价值。现有的
随着社会信息化进程的不断加快,高效而稳定的卫星通信日渐成为人们的需求。卫星通信系统中的关键技术就要保持地面上的天线与卫星实时的对准,让卫星与地面保持稳定的通信,这一技术就是天线跟踪伺服控制技术,也可称为“动中通”技术。通过对国内外天线跟踪系统的研究,设计了一种基于STM32F405微控制芯片的天线跟踪伺服控制系统,其中对载体的姿态检测和转台的运动控制是重点和难点。针对MEMS传感器对载体姿态检测精