音频指纹识别系统的设计

来源 :北方工业大学 | 被引量 : 1次 | 上传用户:nishi1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当我们忘记了歌曲的名称,演唱者等信息,要从海量的音乐信息中检索我们需要的歌曲时,传统的基于文本的音乐检索方式已经不能满足需求,随着音频指纹技术的发展,基于哼唱的音乐检索方式为用户带来了简单、方便、快捷的音乐检索体验。人们只需记起一段旋律或一个片段,就能通过基于哼唱的音乐检索方式检索到我们需要的歌曲。基于哼唱的音乐检索本质上是一种基于内容的音乐检索。人们一般通过旋律特征来记忆歌曲,所以利用哼唱旋律来检索歌曲是一种很自然的方式,通过提取音乐中的音高和音长等特征来表达音乐的旋律,并按照相似度量的方法进行旋律匹配。其中的难点是基音提取、音符切分和旋律的检索匹配,针对这些方面,本文做了如下工作:(1)介绍了哼唱检索的研究现状、发展状况及基本的乐理知识,对声音三要素进行了说明,并阐述了表示级和语义级特征,为特征提取奠定了基础。(2)本文提出了一种基于LPC与AMDF的高精度基音检测算法,减少了基音检测中的半频错误,在高信噪比下具有良好的准确性和鲁棒性。(3)为子得到精确的持续时长,本文提出了一种联合音高与能量的音符切分算法,获得了88.75%的分割准确度。(4)旋律匹配提出了一种联合EMD和DTW的线性伸缩模糊匹配算法,首先以EMD算法得到候选歌曲序列,然后再以候选歌曲序列进行DTW计算返回用户需要的结果,该算法能容忍用户哼唱的音符增加、音符删除和音符替换错误,在精度和速度方面取得了良好的平衡。(5)利用上述算法构建了一个哼唱检索系统,实验结果及分析表明了该系统的有效性和鲁棒性。
其他文献
农安县是玉米生产大县,耕地面积33.33多万hm2,年平均种植玉米面积就达26.67万hm2以上,有的年份甚至超过33.33万hm2。耕作制度上,农民习惯于垄台暄,而垄底和垄沟较硬的垄作方
近些年来,国内移动通信市场与相关技术基本上取得全新发展。其中,天线作为终端设备与基站设备的基础设施,主要承担能量转换器的重任,将开放的电磁波吸收入受约束的设备当中,
凯特·肖邦(1851-1904)是19世纪美国最重要的女作家之一。她一生中创作了两部长篇小说和三部短篇小说集。她的作品多刻画妇女和探讨妇女问题,小说《觉醒》被誉为19世纪女性主义
知识经济的时代特点预示着高等师范教育的发展走向 :开放教育、创新教育、素质教育。同时也引起社会对高师教师角色期待的嬗变 :具有全新的教育理念 ;通晓外语 ,会操作网络 ,
期刊
旅游业目前在我国发展迅猛,据UNWTO(联合国世界旅游组织)最新统计,2010年全世界旅游者人次达到9.35亿,同2009年相比增长了近7%。此外,UNWTO预测,2011年国际旅游者人次将继续
伴随着我国科技水平的提升,国情监测技术、基础测绘都有了很大进步。国情监测技术和基础测绘外业底图制作过程中有很多共同点,针对制作过程中容易出现的问题,更好地衔接内外
在串行生产线中,机器会发生随机故障(即机器不可靠),因此需要维修工人及时维修,使得故障的机器恢复加工能力,否则就可能导致系统吞吐率降低.如何在满足系统吞吐率的前提下,使
作为一部正面刻画同性恋,双性恋及变性者的电影,1994年的《沙漠妖姬》为澳大利亚电影赢得了世人的关注,并且为主流电影观众理解社会性别的建构提供一个不一样的视角,成为了本文的