基于DNN和多模态信息融合的复杂音频场景识别

被引量 : 0次 | 上传用户:asd710601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频场景识别通过分析音频场景中包含的声学事件,实现对音频的高层抽象概念和语义内容上的感知。在实际应用中,如果音频数据中存在大量场景无关的声音干扰,将会导致音频场景识别性能急剧下降。为解决此问题,本文使用深度神经网络(Deep Neural Network,DNN)提取音频场景的高层抽象特征,并引入视频信息作为辅助,进一步对音视频信息的融合机制进行探索,提出基于模型融合的多模态信息融合方法。实验结果表明,基于DNN和模型融合的方法在复杂音频场景识别问题上取得了较大的性能提升。
其他文献
近年来,丹凤县农村安全饮水工程建设步伐加快,国家投入了大量资金建设了许多镇村安全饮水工程,这些供水工程的建设,不但解决了农民的饮水困难和安全问题,同时取得了显著的社会效益
数学建模是把数学理论与数学应用两者联系在一起的重要纽带,是数学思维的重要体现。但是对于高中阶段的学生来说,他们受其知识水平的限制,加之教师在教学中忽视了对学生数学
一、对“二分二至日不同纬度昼夜长短”示意图的数学解析在各个版本的高中地理教材中,在描述地球公转引起的昼夜长短的变化时,都插入了“二分二至日不同纬度昼夜长短”示意图,图
加拿大的一位教授指出:在美国市场从去年撤出的四价恒河猴轮状病毒疫苗对发展中国家儿童的益处可能胜过其带来的风险,且伦理道德上的随机对照疫苗临床仍应该进行。
1月2日报道FDA批准Remicade(R)(infliximab)与甲氨喋呤联用,作为阻止对甲氨喋呤应答不充分的中到重度类风湿关节炎(RA)病人关节结构损伤的第一个药物。它的首次批准是在1998年
Berna公司的鼻腔内预防流感疫苗Nasalflu(Ⅰ)已在瑞士获得许可证,当天即在这第一个市场上市。它是第一个获准的鼻腔内流感疫苗。这家瑞士生物技术公司也已向德国申请许可证,后