论文部分内容阅读
哼唱检索方式是一种方便、新颖、人性化的音乐检索方式,有着广泛的应用前景和重要研究价值。它使得用户在忘记歌词、歌名和作者的情况下,只要哼出旋律就可以找到想要的歌曲。本文针对哼唱音乐检索系统所涉及的关键技术进行了研究,主要包括三个方面:数据库音乐的旋律特征提取、哼唱音乐的旋律特征提取和旋律检索匹配方法。基于此,设计并实现一个基于哼唱的音乐检索系统。主要研究内容有:1.分析对比了常见的音乐文件格式,选择了MIDI格式作为乐曲库音乐文件格式。分析了MIDI文件的结构,然后提出了确定主音轨的方法,并从中提取出音乐文件的旋律轮廓。2.研究了几种基音提取算法,为了系统在速度和精度上都有较好的表现,本文在基音提取这一步选择简化逆滤波法。在提取出基音曲线之后,滤除无声段信号,提高系统可靠性。最后对基音曲线音符切分,从而提取出音高和音长,生成了哼唱信号的旋律特征。3.在旋律匹配部分,分析了几种匹配检索算法的优缺点,结合本系统对准确率和速度的要求,最终确定了分层检索的结构。首先用基于句子长度的N-Gram索引来粗匹配,过滤掉大部分不可能是结果的歌曲;然后使用DTW实现精细匹配。本文在完成上述工作后,对系统进行了实验,并与其他论文进行了对比,结果表明该系统有一定的实用性。