基于E2LSH的音乐哼唱检索系统的研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:wj1982sp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于内容的检索领域中,音频检索是新发展起来的研究热点。音乐哼唱检索是基于内容的音频检索的一个分支,它提供了一种新颖、方便的音乐检索方法,当人们遗忘了歌曲的歌名等信息时,用户可以通过哼唱一段旋律的方式,在大型歌曲数据库中快速寻找到目标歌曲,这种检索方式给用户带来了简单、直观、方便的音乐检索体验。本文分析了当今基于哼唱的音乐检索系统中的一些技术,对旋律特征表示方法、旋律特征提取算法、旋律匹配算法进行了讨论和研究。现今的哼唱检索系统大都忽略了检索速度的问题,本文针对这个问题,将基于精确欧氏距离位置敏感哈希的相似性检索技术应用到哼唱检索中,构建一个快速的音乐哼唱检索系统。本文主要做了以下几个方面工作:1.对哼唱检索系统基础进行了分析。在了解哼唱检索系统结构的基础上,分别研究了旋律特征表示方法以及相关语音信号处理技术,研究了使用MIDI文件建立旋律模板库,研究了旋律特征的提取技术,包括基音周期预估、平滑处理和音符切分,其中,对比了几种基音周期预估算法,YIN的性能较好,然后对旋律匹配过程中音高偏移问题和音长伸缩问题进行分析讨论。2.对旋律匹配技术进行研究。本文对比了线性伸缩(LS),动态时间规整(DTW)和土堆移动距离(EMD)三种旋律匹配算法的性能,针对旋律匹配,对DTW算法进行了动态阈值偏移约束的改进,形成了检索速度较快的改进型DTW(IDTW)。综合EMD与IDTW各自的优点,本文提出了一种旋律匹配算法EMD-IDTW,该方法匹配准确率较高且检索速度较快。3.针对现今哼唱检索系统检索速度慢、需要穷举匹配的问题,本文研究了基于精确欧氏位置敏感哈希(E2LSH)的相似性快速检索技术,对E2LSH及其哈希函数进行了理论分析,将E2LSH检索技术应用到哼唱检索系统中,建立了基于pitch向量的E2LSH索引结构,利用该索引结构进行第一层检索,加快了系统检索速度。本文结合EMD-IDTW匹配算法,提出了Pitch-E2LSH+EMD-IDTW旋律匹配方法。最后本文构建了基于E2LSH的音乐哼唱检索系统,该系统在保证检索准确率的情况下,大大提高了检索速度。
其他文献
近年来,自组网因其方便、灵活的特征受到很多人的青睐。军事和商业等领域对自组网的需求日渐上升。随着需求的增大,如何保证通信的质量就成为重要的研究问题。如今自组网已经
多发性硬化症是一种中枢神经系统的疾病。现阶段,核磁共振成像(MRI)正在被广泛的使用在多发性硬化症的诊断上。通过医学专家手动分割MR图像上的多发性硬化症病变组织是一件非
计算机网络通信是当前主要通信方式之一,因特网技术的快速发展使得全球通信更加便捷。全球通信网采用的主要网络协议是TCP/IP协议,此协议中包括网络层和传输层。传输层中传输
超市作为现代社会中必不可少的购物场所,越来越受到消费者的青睐。商品是超市的核心,货架商品信息获取的准确性和实时性将直接影响超市的运作效率和综合竞争力。目前这些工作
由于扩频通信具有保密性好,抗干扰性强的特点,因此在各个领域内倍受关注,至今,扩频通信技术已经被非常广泛的运用在军事、民事、和商业领域。扩频通信系统虽然优点众多,运用
图像分割作为多数基于图像分析智能技术的基础,在自然、遥感、医学图像分析等领域均有广泛应用。变分水平集方法以其良好的拓扑结构变换、多种驱动能量优化融合以及有效的数
为解决传统暗原色先验的单幅图像去雾算法实现效率低以及恢复雾化图像在天空、白云等明亮区域颜色失真的不足。实现一种改进方法,通过分块思想,完成透射率的空间自适应估计;通
变化检测技术是遥感图像处理的重要应用之一。遥感图像变化检测是通过对同一区域不同时期的两幅已配准的遥感图像进行分析,检测出该区域地表变化信息的过程。变化检测技术在自然灾害监测、生态环境监测、战场动态监视等领域得到了广泛的应用。本文主要研究了基于分数阶Fourier变换(Fractional Fourier Transform, FRFT)和Gabor小波的遥感图像变化检测算法,主要内容如下所述:1、
三维电视(3DTV)技术能够录制、传输和显示三维彩色图像,使观众能在欣赏电视节目时产生身临其境的真实感。近几年,裸眼3DTV由于无需借助立体眼镜即可裸眼体验立体感觉而成为目
透地通信采用大地介质作为传输信道,信道特性稳定,不易受灾害的影响,因而在矿山、地质等灾害救援等方面起着重要作用。但是地层环境非常复杂,对高频电磁波衰减非常严重,因此