论文部分内容阅读
随着数字音乐技术和互联网的发展,在线音频检索已经引起了越来越多的关注。目前这方面的研究相对滞后于对视频和图像处理的研究。例如,对于大多数的基于内容的音乐检索(CBMR)系统,它所要完成的任务就是根据所提供的一些具有一定语法的实体例子的某些特征属性返回相似的音乐对象。这些手段让用户有能力去搜索他们听过的音乐。但是有的时候,用户所要搜索的音乐并非是他们所了解的,也许是未知的。同时,人们有时候希望检索那些感觉上和某个音乐对象或者音乐类型相似的对象。目前,尚无太多的出版物研究基于内容的音乐检索。
本文详细地分析和研究了音频检索的现状和现有系统,比较了现有系统的优缺点并总结了其中的不足。在深入分析音频的特征和特征抽取等技术基础之上,针对音频媒体中的音乐媒体,设计了基于旋律类型的音乐查询接口,并描述了其工作方式,最后通过实验评测了所设计的方法。
论文主要工作包括以下几个方面:
1) 系统整体地介绍了音频检索和目前流行的基于内容的音频检索,特别是音乐检索技术的相关内容。
2) 详细分析和研究了现有MIR系统,并比较了这些MIR系统的优缺点,同时针对本文关注的音频查询接口问题,指出了现有MIR系统的不足。
3) 音频的非语义形式和无结构化组织的特点阻碍了音频检索的发展,因此,如何提取音频中的结构化信息和内容语义,使得无序的音频数据变得有序,是解决问题的关键。音频特征分析和抽取是音频分类的基础,这里我们对音频的特征进行深入的分析。
4) 描述了一种基于旋律特征的CBMR方法,同时提出了四种基于旋律特征的提问方式。论文重点评测了所涉及的类型查询方法的性能。所有的波形音乐文件都是从网上搜集得来,对于库中的每个音乐文件,旋律抽取以及和音分配等预先工作都已经完成。
我们计算出用户每轮查询的精度和平均得分,同时均分每个用户的精度和平均得分。试验证明所提出的提问方法可以提供一个满意的基于旋律特征的查询手段。