基于听觉图像的音乐流派自动分类系统研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:persistence2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,网络上的音乐信息成千上万,如何在最短时间内筛选出满足用户需求的音乐,成为现代生活中亟待解决的问题。于是,基于内容的音乐信息检索技术成为信息检索领域至关重要的技术,音乐流派自动分类成为近年来研究的热点之一。本文将听觉图像引入音乐流派自动分类的研究中,采用听觉图像模型,设计滤波器等模拟人耳耳蜗的结构功能,将一维音频信号转换为二维听觉图像。然后,对不同音乐流派的听觉图像进行尺度不变特征转换(SIFT)及空间金字塔匹配(SPM),提取不同流派听觉图像的纹理特征。其中,尺度不变特征变换可以提取不同空间位置上听觉图像灰度值相对位置、大小关系和梯度方向信息,能够更加全面的描述图像局部特征;而空间金字塔匹配方法在3个不同层次上将稀疏化的听觉图像局部特征以不同刻度整合起来,表征听觉图像在不同层次上的全局特征。基于听觉图像的特征向量是高维度的、稀疏化的向量,本文分类方法选取在音乐流派自动分类中效果较明显的K-最近邻分类器和支持向量机。不同k值的K-最近邻结点算法和不同核函数的支持向量机构成不同的分类器的分类结果不同,比较可知,线性支持向量机在本文系统中分类效果优于K-最近邻分类器和其他核函数的支持向量机。比同样基于人耳耳蜗结构提取的MFCC特征分类正确率提高15%;比增加了模糊映射的音色特征集分类正确率高6%左右;与同样从图像角度出发,分析MFCC频谱图和短时傅里叶变换频谱图相比,分类正确率也有所提高。
其他文献
近几年来,认知无线电作为一项能够高效利用频谱,改善频谱利用情况的技术,引起通信界广泛关注。以往对于认知无线电系统的研究主要集中在频谱检测、频谱管理、功率控制、干扰
上个世纪六十年代,世界第一款单电极电子耳蜗面世,经过近半个世纪的发展,如今的电子耳蜗可植入的电极数已达到22个,由于受到植入电极之间电流扩散的影响,可植入电极的数量一直不能
近年来移动终端用户数量与日俱增,手机逐渐成为一种全新的媒体形式,是最具普及性且最为方便快捷的媒体平台,具有信息可个性化定制、成本十分低廉等优势。因此,通过手机或者平板电
卫星通信在未来战争中的作用越来越重要,能否干扰敌方卫星通信,在很大程度上能决定局部战争的胜负。第三代国防通信卫星(DSCSⅢ)系统采用了多种抗干扰技术,有很高的抗干扰能
近年来,频发的雾霾等恶劣天气对于户外视频监控系统的正常工作造成了严重影响。在雾霾天气下,通过摄像机所采集到的视频图像经常会出现色彩偏移、对比度下降、整体灰白等图像
透地通信系统是能够解决矿井安全问题的重要途径,但是建立稳定可靠的透地通信系统有一定的难度,由于大地介质是导电介质,所以电磁波在其中传输时存在严重衰减,又由于大地的复杂结
超低频弹性波透地通信系统发射机发出的弹性波经过大地信道后,能量会发生衰减并被大地背景噪声湮没,信号到达接收机时信噪比很低,无法进行正常处理,所以需要进行微弱信号检测来提
作为未来通信网络的一个重要发展方向,空天信息网络具有大范围持续通信和监测能力,在通信保障、资源利用以及对地观测等领域都具有广阔的应用前景,对于提升国家的国际竞争力
光纤光栅(FBG)传感技术是目前发展较为迅速的传感技术之一。由于光纤光栅传感器具有体积小、重量轻、抗电磁干扰、灵敏度高、结构灵活等优点,在建筑、航天、医学、石油等领域取
随着高清视频应用的飞速发展,人们对于视频压缩的性能要求也越来越高。相较于H.264/AVC压缩标准,新一代视频压缩标准HEVC具有更高的压缩效率和更好的压缩质量。HEVC采用混合编