梅尔声谱图相关论文
[目的/意义]情感是目前在线音乐平台常用的资源组织与检索方式之一,利用特征融合对歌单、歌曲的情感分类进行探索研究,能够优化音乐......
语音合成是通过机械的、电子的等方式产生人造语音的技术,在当今人工智能发展的浪潮中又表现出了新的高度。在语音合成的三个层次......
音频分类(audio classification)是计算机听觉相关研究的主要方向之一,需要根据声音的内在特点对不同声源进行分类。随着深度学习......
在拥有海量数据和强大计算能力的人工智能时代,音频场景分类成为了场景理解的重要研究内容之一.针对音频场景分类建模困难和精确率......
在个性化应用愈益重要的今天,音乐情感识别越来越受到研究者的关注。通过结合音乐的梅尔声谱图表示及卷积神经网络,采用迁移学习方法......
环境声音分类(ESC)是音频处理领域的重要分支之一,在未来多媒体应用中有重要的作用。音频识别是提取音频中特定的声学特性,将音频......
音频信号包含很多信息内容,通过音频信号处理技术,人们可以更好感知和理解周围的环境,因此该技术已经被广泛应用于监控、助听器设......
环境声音分类(Environmental Sound Classification,ESC)是音频处理领域中的重要分支之一。ESC任务在机器人导航、音频检索、音频......