CNN-XGBoost混合模型在音频场景分类中的应用

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:ej17255
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在拥有海量数据和强大计算能力的人工智能时代,音频场景分类成为了场景理解的重要研究内容之一.针对音频场景分类建模困难和精确率不高的问题,本文提出一种基于卷积神经网络和极端梯度提升算法相结合的系统模型.首先,将预处理后的音频信号转换成梅尔声谱图,然后输入到卷积神经网络中完成抽象特征提取,最后利用极端梯度提升算法进行分类.为了评估模型的有效性,在城市音频场景UrbanSound8K数据集上进行分类性能测试,结果表明,该混合算法模型对音频场景的分类精确率可以达到89%,优于传统的神经网络算法模型,说明该混合模型对音频场景分类问题的有效性.
其他文献
目前已有的不完整数据填充方法大多局限于单一类型的缺失变量,对大规模数据的填充效果相对弱势.为了解决真实大数据中混合类型变量的缺失问题,本文提出了一个新的模型——SXG
  本文针对当前担酸盐光催化剂制备中存在的问题,首次制备了不同形貌的纳米担酸盐光催化剂KTa2(O,OH)6·xH2O,研究了不同形貌材料在紫外光下降解罗丹明B的性能,发现具有八面体
来自多源感知设备所采集的多模态交通数据,由于探测设备、网络、数据传输等错误往往存在丢失.交通数据的缺失对交通网络智能规划、避免拥堵等会产生重大的负面影响.同时,来自
针对具有控制量约束和可视性约束的六自由度机器人的视觉伺服系统,研究了基于图像空间局部模型的预测控制器的设计问题.首先对特征点的投影图像的运动学方程进行离散化,得到
针对传统的流行排序显著性检测算法存在的问题,本文提出了改进背景先验和前景先验的显著性检测.首先计算图像的凸包,并将图像分割成不同尺度的超像素;然后以凸包区域之外的超像素为背景种子,结合多尺度下图像的多种底层特征得到最终的背景显著图;第三,以凸包区域之内的超像素为前景种子,结合多尺度下图像的多种底层特征得到最终的前景显著图;第四,融合最终的背景显著图和最终的前景显著图得到弱显著图,通过多核增强(MK
绝缘子图像中存在的噪声对提取绝缘子细节纹理特征具有较大影响,单个特征描述子不能描述绝缘子的更多细节纹理特征,而提取到绝缘子细节纹理特征的多少直接影响了绝缘子缺陷检测的精度和速度.针对以上问题,提出改进快速导向滤波算法和融合PHOG与BOW-SURF特征来实现绝缘子缺陷的精确检测.首先,采用改进的快速导向滤波算法对接触网绝缘子原始图像进行滤波;然后,提取绝缘子滤波后图像的PHOG和BOW-SURF特
  近年来利用绿色化学来处理水资源的有机污染物是一个非常活跃的研究课题。在我们前期的工作中,已经证明系列四(1,4二噻英)四氨杂卟啉铁负载到树脂上后,能够模拟细胞色素P
会议
  石墨烯作为一种优越的二维纳米材料,己被广泛用作光催化半导体粒子的载体。大量的实验表明:由于其具有高的载流子迁移率,可以抑制光生空穴和电子的复合,因而石墨烯的添加能够
会议
  半导体光催化技术作为一种"绿色"技术广泛应用于大气和水污染处理.NOx能够被光催化剂产生的自由基物种氧化为NO3-和HNO3吸附在催化剂表面,最终在雨水冲刷下被大气颗粒物
会议
  光催化技术在能源和环境领域都有着重要的应用前景,然而,传统的用于光催化剂的半导体氧化物如TiO2等有着较宽的带隙,不能充分地利用占太阳能43%的可见光,从而限制了它的应用。
会议