基于稀疏分解的音符识别研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:gyl722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐是人们日常生活的重要组成部分,可谓是人类精神生活的润滑剂,从古至今音乐的熏陶与鼓舞从未间断。分析音乐信号对研究音乐有积极的促进作用,而音乐信号音符识别在自动音乐标注、音乐分离、音乐检索等研究领域扮演重要角色。目前主要使用信号时域分析、频谱分析等技术估计音乐信号的基频,从而得到混合音的音符组成,但由于音乐信号存在高次谐波频率偏移,基频消失,低音基频间隔太小,频谱重叠等基频提取过程中的难点,导致现有时域、频域信号处理方法检测多基频混合音乐信号基频时都存在或多或少的不足之处。尽管如此,现有的音乐信号多基频提取算法从不同的角度出发,为解决音乐多基频估计的难点提供了诸多的思路,如采用人耳滤波器解决频率偏移问题,用周期或较高的频率分辨率识别低音区音符组成的音乐信号。在这些优秀的成果基础上,本文主要做了如下工作:1、稀疏分解作为一种新兴算法,在信号处理领域中有着诸多的优良特性。文中将信号稀疏分解算法引入到音乐信号多基频估计领域,围绕音乐基频定义和音乐信号的数学模型,利用音符基频分布的频域稀疏性,采用匹配追踪(Match Pursuit,MP)法提取音符的频谱分布特征。2、引入人耳的听觉响应模型,模拟人耳的频率响应特性,采用多分辨率分析技术建立起模拟听觉特征的原子库。将信号分解到模拟听觉特征的原子库上,用MP分解系数反应音乐信号的听觉特征,得到与音符一一对应的简化表述,从而提取出音符的听觉频域分布特征。3、应用琴弦振动发声类乐器的音乐人工合成技术,推导得到钢琴音符的基频及其各次谐波的能量呈指数规律衰减。按此规律,用MP算法提取到的音符听觉特征,重建各音符的音色即频谱分布。根据音色,使用目前学术界广泛认同的音乐信号正弦模型重建出音符时域信号,建立起音符原子库。4、提取混合信号的听觉响应特征,再由此特征对信号进行简化的重表述,采用基追踪(Base Pursuit, BP)算法将混合信号分解到音符原子库上,取分解系数实现混合音乐信号的多基频估计,从而得到混合信号的音符组成。在仿真试验中,该算法取得了很高的准确率。
其他文献
随着信息技术的不断发展,物联网具有广阔的应用前景。RFID技术作为物联网核心技术之一,也得到了很广泛的应用和发展。阅读器作为RFID系统重要组成部分,在系统中起着重要作用,具有
当大规模流感或传染性疾病爆发时,在学校校园这种人群居住比较密集的环境下,一旦出现一例传染源,将容易导致发生大规模传染性疾病。在监控流行性传染病的指标中最直接的指标
针对LTE系统中小区间干扰比较严重,已有的干扰协调技术不能很好的解决边缘用户频谱效率低的问题,在LTE-Advanced系统中引入了协同多点传输和接收(CoMP)技术。该技术通过各个小
TD-SCDMA(时分-同步码分多址)是由CWTS(中国无线通信标准化组织)提出的、拥有我国自主知识产权的第三代移动通信标准(简称3G)。该标准将智能天线、联合检测、同步CDMA和SDR(
环境监测工作是一项比较复杂的科学技术活动,环境监测现场采样的质量,直接影响到环境监测结果.因此,做好环境监测现场采样质量控制,对提高环境监测的准确性有很大帮助.本文主
随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,
随着社会人才需求的变化,我国高校在培养大学生过程中,学生创新创业能力的培养越来越受关注,文章从多角度针对大学生创新创业能力的培养进行了分析,提出了合理化的建议.本文
本文主要阐述了基于FPGA的10G EPON物理层的设计与实现。首先介绍了以太网技术、接入技术的发展历程以及10G EPON系统的工作原理和相关理论知识,随后介绍了ESL建模在整个系统
随着通信技术的不断发展,现代通信系统对通信的有效性和可靠性提出了更高的要求,如何有效提高这两项相互矛盾又相互制约的性能指标,一直都是通信领域的研究热点,并且通信系统的安
移动互联网的快速发展极大地刺激了人们对无线通信高数据速率和多业务服务的需求。然而无线频谱资源非常稀缺,因此提高其利用率是无线通信研究的重要内容之一。正交频分复用(Or