论文部分内容阅读
在数字音乐数量急剧增长的今天,由于音乐本身的复杂性、音乐类属定义的模糊性和对人类听觉感知特性认识的有限性,音乐自动分类相关课题的研究还处于起步阶段,而音乐自动分类是实现音乐资源快速、有效检索的前提,其潜在应用需求巨大,因此音乐自动分类相关课题具有重要的研究价值。本文针对MFCC倒谱系数、时频分析等经典音频信号分析理论在提取结构和信息丰富的音乐特征时的局限性,分别结合人耳听觉模型、听觉系统感知特性、稀疏编码理论、同态分析、时频分析及音乐信号的固有属性,提出了多种能更精确地反映音乐信号特征的算法,对音乐信号特征进行了深入研究。首先,提出了全信息MFCC算法。该算法是对同态分析中传统的Mel频率倒谱系数的改进,由于利用了音乐样本所有可能组合的信息,从而有效抑制了信号截断引起的频谱泄漏,凸显出音乐信号的频谱特征,并能捕捉音高变化的信息。其次,提出了音乐仿生小波算法。该算法基于改进型Giguere人耳听觉模型和人类听觉系统品质因数的变化特性,结合听觉临界频带,将反映动态变化特性的参数和听觉掩蔽效应引入小波变换,因此具有时间、频率二维独立可调精度,能够跟随音乐信号的瞬时幅度和一阶微分进行自适应地调整。再次,提出了基于音乐特征成分近似负熵极大化的音乐特征基矢量构造和稀疏表示算法。该算法以稀疏编码理论和神经生理学中生物系统对信息处理的稀疏化解释为依据,更好地反映了音乐的特点和结构。文中还利用近似不相关分解,将该算法推广到具有更多结构和特征的超完备特征基向量空间。最后,提出了有噪情况下线性混合乐器的盲分离算法。该算法利用了音乐信号的时间相关统计特征和时序结构,结合时延协方差矩阵和四阶互累积量矩阵,采用了平均特征结构的稳健正交化方法,成功实现了不同类乐器的分离。上述算法的提出改善了对音乐特征及结构信息的表示,因此正确地分离了乐器,与无监督聚类方法结合,实现了音乐的自动分类。