音乐特征分析及其在音乐检索中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:www_073
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展和信息时代的到来,数字音乐的数量越来越庞大。如今网上有很多站点提供音乐在线播放和下载,这些站点往往收录了成千上万甚至更多的音乐;即使是在个人电脑上,收藏的音乐通常也会有几千首。越来越多的音乐使人们获得了更为丰富的艺术体验,但同时也给音乐库的管理和检索带来了很大的困难,因此有必要研究新的智能化的音乐管理和检索方法。基于哼唱的音乐检索是一种智能化的音乐检索方法,它与传统的基于文本的检索方法有着根本的区别。本文的研究内容就是基于哼唱的音乐检索,它涉及到两个关键的问题:如何准确地从音乐中提取得到特征(通常是基音提取)以及如何准确地进行特征间的匹配(通常是使用动态时间规整算法)。在特征分析方面,基于哼唱的音乐检索绝大部分都使用了基音作为音乐的特征,所以特征分析的关键就是如何准确地从音乐中提取得到基音特征。针对背景音乐对基音提取的干扰,本文提出了一种新的基于基频矩阵的基音提取算法,该算法利用基频矩阵来进行基音提取,从各种可能的基频中找出最为可能的基频值,即使在很强的背景音乐下依然能够准确提取得到歌手唱声的基音,从而保证了检索系统的准确性。在特征匹配方面,虽然目前常用的动态时间规整算法能够实现时间对准,可以纠正哼唱输入的时间误差,但是哼唱输入除了时间误差外还有音调误差,本文对动态时间规整算法进行了改进,引入了高度(音调)动态调整,在特征匹配的过程中动态调整哼唱输入的音调高低,使之能够纠正哼唱输入的音调误差,提高了特征匹配的准确性。另外考虑到特征匹配的算法复杂度太高,本文引入了可变长搜索,它在已知匹配起点后能够一次得到匹配的长度,简化了搜索的复杂度,从而提高了检索的速度。在使用本文提出和改进的算法对2250首wav格式的音乐组成的音乐库和100首哼唱输入进行的实验中,Top 10的准确率达到87%,Top 5达到70%,Top 3达到59%,而Top 1也达到36%,证明了本文提出的基于基频矩阵的基音提取算法以及改进后的动态时间规整算法是可行而且有效的。
其他文献
巴西位列金砖国家,综合实力居拉美地区首位,越来越多的我国企业已经开始关注并涉足巴西这一市场。但巴西国内对劳工管理方面要求较复杂,做好当地化员工管理,将对项目顺利实施
为了研究荷电细水雾对瓦斯爆炸超压的影响规律和机理,采用小尺寸管道模拟瓦斯爆炸,研究不同荷电电压作用下的瓦斯爆炸超压和平均压升速率,以及不同雾通量作用下的瓦斯爆炸超
采用文献资料、逻辑分析等研究方法,针对大学生运动性猝死的原因、运动性猝死发生后的法律归责以及大学生体育运动性猝死的防范措施进行了探讨,分析了体育教师、学校和大学生
本文首先介绍了破碎相关概念及破碎理论,在此基础上,对选矿厂常见破碎设备进行详细阐述,包括颚式破碎机、圆锥破碎机、冲击式破碎机及辊式破碎机,并对近年来研究应用较多的新
CI包括MI、BI、和VI三部分,三个子系统三位一体,才能成为全面的CI战略。通过概念和实例的阐述告诉人们实施CI战略可以塑造良好的企业形象,增强企业的凝聚力。
乡村振兴战略和农业供给侧结构性改革是在新的时代背景下解决三农问题的关键,实现乡村振兴是解决三农问题的目标,而农业供给侧结构性改革则是实现乡村振兴的措施和途径。在总
林语堂的《吾国与吾民》是一部向西方讲述中国文化的重要著作。本文深入分析了《吾国与吾民》中林语堂始终保持的理性立场和客观冷静的态度,阐明了林语堂的中庸姿态和他在东
环境事件是由人为原因造成的对环境生态的污染与破坏,进而影响到人的正常生活和生产的事件。环境事件具有较大的社会风险,具体表现在四个方面,即污染环境,危害人民健康,引发
运用重力模型和综合客运模型,对淮海经济区城市间的经济联系势能及经济联系流强度进行测度,据此分析该区的城市经济辐射与经济隶属情况。结果表明,淮海经济区城市间的经济联
改革开放的三十多年,我们取得了举世瞩目的发展成就,然而发展带来的环境污染也触目惊心。虽然各级政府一直没有停止过环境的治理,并取得了一定的成效。但是,并未能从根本上解