论文部分内容阅读
音乐是人们日常生活的重要组成部分,可谓是人类精神生活的润滑剂,从古至今音乐的熏陶与鼓舞从未间断。分析音乐信号对研究音乐有积极的促进作用,而音乐信号音符识别在自动音乐标注、音乐分离、音乐检索等研究领域扮演重要角色。目前主要使用信号时域分析、频谱分析等技术估计音乐信号的基频,从而得到混合音的音符组成,但由于音乐信号存在高次谐波频率偏移,基频消失,低音基频间隔太小,频谱重叠等基频提取过程中的难点,导致现有时域、频域信号处理方法检测多基频混合音乐信号基频时都存在或多或少的不足之处。尽管如此,现有的音乐信号多基频提取算法从不同的角度出发,为解决音乐多基频估计的难点提供了诸多的思路,如采用人耳滤波器解决频率偏移问题,用周期或较高的频率分辨率识别低音区音符组成的音乐信号。在这些优秀的成果基础上,本文主要做了如下工作:1、稀疏分解作为一种新兴算法,在信号处理领域中有着诸多的优良特性。文中将信号稀疏分解算法引入到音乐信号多基频估计领域,围绕音乐基频定义和音乐信号的数学模型,利用音符基频分布的频域稀疏性,采用匹配追踪(Match Pursuit,MP)法提取音符的频谱分布特征。2、引入人耳的听觉响应模型,模拟人耳的频率响应特性,采用多分辨率分析技术建立起模拟听觉特征的原子库。将信号分解到模拟听觉特征的原子库上,用MP分解系数反应音乐信号的听觉特征,得到与音符一一对应的简化表述,从而提取出音符的听觉频域分布特征。3、应用琴弦振动发声类乐器的音乐人工合成技术,推导得到钢琴音符的基频及其各次谐波的能量呈指数规律衰减。按此规律,用MP算法提取到的音符听觉特征,重建各音符的音色即频谱分布。根据音色,使用目前学术界广泛认同的音乐信号正弦模型重建出音符时域信号,建立起音符原子库。4、提取混合信号的听觉响应特征,再由此特征对信号进行简化的重表述,采用基追踪(Base Pursuit, BP)算法将混合信号分解到音符原子库上,取分解系数实现混合音乐信号的多基频估计,从而得到混合信号的音符组成。在仿真试验中,该算法取得了很高的准确率。