【摘 要】
:
声学事件识别系统的性能很大程度上取决于音频特征学习的有效性。由于音频信号属于时序性信号,要获得有效的音频特征,就需要提取其中的时序信息。作者曾提出了一种有效的时序
【机 构】
:
哈尔滨工业大学计算机科学与技术学院
【基金项目】
:
国家重点研发项目(2017YFB1002102),国家自然科学基金(91120303)
论文部分内容阅读
声学事件识别系统的性能很大程度上取决于音频特征学习的有效性。由于音频信号属于时序性信号,要获得有效的音频特征,就需要提取其中的时序信息。作者曾提出了一种有效的时序性特征学习方法:时序池化。然而,由于其需要求解一个没有闭式解的优化问题,导致无法灵活地运用在当前流行的深度学习框架之中。为此,本文在保留时序池化的前提下,提出了一种计算方式更为简单的快速近似时序池化方法。基于此方法又进一步提出一种用于解决端到端声学事件识别问题的卷积神经网络。实验结果表明,所提出的网络可以取得比目前大多数方法更好的识别性能。
其他文献
Web深刻地改变了社会生活,新闻和博客网站作为其中代表性的消息来源,为人们提供了方便的信息获取方式。在Web分析的实际业务中,广告、文章推荐等无关信息的存在,给新闻和博客
针对单一聚合物段塞驱存在低渗储层动用程度低、部分注入井注入困难以及油井受效比例低等问题,开展了高、低浓度聚合物段塞交替注入提高采收率技术研究。采用物理模拟的实验
近年来,我国跨境电商飞速发展。随着跨境电商规模越来越大,不少跨境电商企业在经营过程中碰到财税合规方面的问题,却不知道如何妥善解决,也不了解日后如何规避。本文尝试结合
金融行业是我国的支柱型产业,金融行业的发展直接影响着我国的经济状况。自改革开放以来,我国金融行业的发展可谓是一往无前、所向披靡。在这么短的时间内就已经发展成为世界
图像语义分割致力于将图像中的内容识别出来,即识别出图像中每个位置像素的类别。基于全卷积神经网络的语义分割方法取得了良好的进展,然而这种方法需要大量的且极其耗时的像素级别的标注,为了解决这个问题,基于弱监督和半监督的研究逐渐受到关注。在目前的弱监督和半监督算法中,大部分使用基于手工设计的算法来生成图像区域建议,没有充分利用图像的边界框标注信息。针对这个问题,本文提出了基于学习的弱监督和半监督图像语义
SWOT分析是企业运营中常见的优劣势分析方法。利用SWOT法分析榆林本地旅游的发展现状,发现其在全域旅游发展中的机会、威胁、优势和劣势,有助于后续深入查找本地旅游中存在的
为明确致密油藏注水吞吐渗吸驱油机理,评价各因素对渗吸驱油效果的影响,以鄂尔多斯盆地西北部地区长7储层天然岩心为研究对象,开展了岩心注水吞吐渗吸驱油实验,评价了表面活
随着经济的发展,产业结构也随着经济增长而产生变动,而产业结构的优化作为现代经济增长引擎的核心动力之一,又反作用于经济增长。因此,对产业结构与经济增长进行实时地分析对
目的:通过Micro-CT观察糖尿病大鼠牙槽骨微结构的变化。方法:雄性SD大鼠随机分为2组:对照组(n=4)和STZ(糖尿病)组(n=4)。糖尿病组大鼠腹腔内注射55 mg/kg链脲佐菌素。饲养12
随着信息化技术的广泛应用,信息技术驱动传统行业创新发展,提高在传统行业财务管理与控制有效性。在医院财务管理工作中,通过融入信息技术手段,能够提高财务管理效率,提高财