基于内容的MP3音乐检索研究和实现

来源 :厦门大学 | 被引量 : 0次 | 上传用户:nineoneone911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的音乐检索就是把音乐本身的内涵,如节奏、旋律、和弦、伴奏音型、音色等,作为查询条件,对一个由不同格式的音频媒体(如MIDI、MP3或其它格式的波形音乐)所构成的音乐数据库实施查询检索以获取数据库中满足查询条件或包含相同或相似音乐片段的音乐资源。这些表征不同音乐内涵的查询条件可以通过哼唱或借助现有的乐谱输入工具输入到检索系统中以实施检索。本论文对基于内容的MP3音乐检索技术进行了研究,并实现了一个灵活的具有多种查询音乐输入方式的MP3音乐检索原型系统。目前,大部分基于内容的音乐检索系统所检索的对象都是MIDI音乐,对MP3音乐检索的研究相对来说比较少,并且查询音乐的输入方式也大都比较单一。鉴于不同的用户具备不同的音乐素养及拥有不同的查询音乐资源,本论文提出了在MP3音乐检索系统中引入多种查询音乐输入方式,包括五线谱输入方式、类简谱输入方式、哼唱输入方式、单音色且单声部的MP3音乐文件输入方式和多声部的MP3音乐文件输入方式。而由于当前对波形音乐的音高辨识技术的研究还不够成熟,且用户在哼唱输入时对音准和旋律节奏也并非能准确把握,这都使得系统最终获得的查询旋律特征与用户所期望的查询旋律会存在一定的差距,自然影响到检索的准确性。为此,本论文还提出通过多种交互手段使用户可以根据自己的音乐能力来判断和校正系统所获取的音乐旋律特征,以进一步提高检索的准确性和增强系统的可用性。在检索匹配多声部MP3音乐数据库的实现技术上,本论文针对单音色、单声部音乐和多声部音乐这两种类型的查询音乐的不同特点分别使用了不同的匹配方法。对于前者,本论文提出了一种包含休止符归并和长音分段的二次规整匹配新算法,并通过原型系统进行了实验模拟分析,证明了该算法的有效性。对于后者,本论文将Jeremy(2004)提出的基于和声模型的多声部MIDI音乐检索多声部MIDI音乐数据库的技术推广到使用多声部MP3音乐片段检索多声部MP3音乐数据库,分别构建了HMM和声模型和Markov和声模型两种检索模型,实验结果表明这两个模型都具有一定的实用价值。
其他文献
颜色恒常性计算是一个多学科交叉性很强的研究课题,融合了计算机视觉、信号处理、人工智能和认知科学等学科的相关技术,用于解决计算机视觉中的物体识别、对象跟踪、视频监控
正交投影在几何建模、计算机图形学以及计算机视觉等领域受到广泛的关注。正交投影在曲面曲线的设计、曲面与曲线的拟合方面有着重要的应用;同时,它也是形体匹配的ICP算法中
空气是我们共享的重要的生存资源,但是近年来某些区域的空气质量却呈现出逐渐恶化的趋势,尤其是对于一些发展中国家的超大型城市,如北京和新德里,空气污染已经成为这些城市一个很严重的问题。在空气污染的众多维度中,细粒度颗粒,尤其是PM2.5近来越来越受到人们的关注,其中很重要的原因在于PM2.5在人们身体健康的直接影响,有研究资料表明PM2.5粒子很容易被人体肺部器官吸收,长时间的PM2.5环境会导致呼吸
移动自组织网是一种由带有无线通信装置的移动终端所组成的无中心控制系统的网络,其最大的特点是自治和多跳,具有组网快速、抗毁性强等优点,被应用于军事通信、灾难紧急救助
随着IP技术的发展和成熟,越来越多的业务将转为在IP网上实现,未来网络是以IP为核心传送网的下一代网络(Next Generation Network,NGN)。现有的网络将逐步融合,其中IP网络和电信
随着我国移动通信网络规模的不断扩大和通讯技术的不断成熟,我国的移动通信用户数量不断增加,国内通信市场的竞争也越来越激烈。提供更加优质的服务,满足用户各种各样的需要,已成
随着计算机技术的快速发展,CG技术逐渐取代了效率低下,成本高的传统动画技术,CG产业已成为新兴的创意工业,商业价值巨大。在CG制作过程中,产品设计制作并非一次就能成功,一件
生物信息数据库贮存了生物信息学研究的原始数据和各类计算结果数据,可以提供给生物学家们思考分析以及进一步探究其表达的生物学含义,具有非常重要的意义。然而,针对生物信
脑机接口(BCI)是一种快速发展的新兴技术,其研究目的是建造一个人脑和计算机之间通信的直接通道。一个有效的BCI系统应该包括三个步骤:一是记录脑电(EEG)信号;二是从记录的脑
随着现代工业、国防等各个行业的发展,最优输出跟踪理论在海洋信息探测技术、空间技术、经济运行系统、智能机器人、化工等工业领域得到了越来越多的应用。因此,研究最优输出