基于内容音频检索技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:maailin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字音乐技术和互联网的发展,在线音频检索已经引起了越来越多的关注。目前这方面的研究相对滞后于对视频和图像处理的研究。例如,对于大多数的基于内容的音乐检索(CBMR)系统,它所要完成的任务就是根据所提供的一些具有一定语法的实体例子的某些特征属性返回相似的音乐对象。这些手段让用户有能力去搜索他们听过的音乐。但是有的时候,用户所要搜索的音乐并非是他们所了解的,也许是未知的。同时,人们有时候希望检索那些感觉上和某个音乐对象或者音乐类型相似的对象。目前,尚无太多的出版物研究基于内容的音乐检索。 本文详细地分析和研究了音频检索的现状和现有系统,比较了现有系统的优缺点并总结了其中的不足。在深入分析音频的特征和特征抽取等技术基础之上,针对音频媒体中的音乐媒体,设计了基于旋律类型的音乐查询接口,并描述了其工作方式,最后通过实验评测了所设计的方法。 论文主要工作包括以下几个方面: 1) 系统整体地介绍了音频检索和目前流行的基于内容的音频检索,特别是音乐检索技术的相关内容。 2) 详细分析和研究了现有MIR系统,并比较了这些MIR系统的优缺点,同时针对本文关注的音频查询接口问题,指出了现有MIR系统的不足。 3) 音频的非语义形式和无结构化组织的特点阻碍了音频检索的发展,因此,如何提取音频中的结构化信息和内容语义,使得无序的音频数据变得有序,是解决问题的关键。音频特征分析和抽取是音频分类的基础,这里我们对音频的特征进行深入的分析。 4) 描述了一种基于旋律特征的CBMR方法,同时提出了四种基于旋律特征的提问方式。论文重点评测了所涉及的类型查询方法的性能。所有的波形音乐文件都是从网上搜集得来,对于库中的每个音乐文件,旋律抽取以及和音分配等预先工作都已经完成。 我们计算出用户每轮查询的精度和平均得分,同时均分每个用户的精度和平均得分。试验证明所提出的提问方法可以提供一个满意的基于旋律特征的查询手段。
其他文献
本文提出了在客户端采用动态反馈缓冲的算法。该算法的原理是在客户端动态划分一段内存空间作为来自发送端的流媒体的数据缓冲,根据不同网络情况动态改变该缓冲区的大小,使得客
互联网行业的不断发展壮大所带来的数据风暴充斥着人们的生活,特别是由此而带来的商业价值吸引着众多人的眼球,而巨大的商业价值来源于对海量数据的提取分析,但是传统的数据挖掘
本文以湖南省国土资源厅电子政务建设为研究背景,以系统科学理论为指导,综合运用信息学、计算机科学、土地资源管理学等多学科知识,应用软件工程的理论和方法,通过对湖南省国土资
本文论述了LINUX内核结构及其开发实践。 1991年,linus torvalds开发出最初的Linux,这个操作系统适用与基于intel 80386微处理器的IBM PC兼容机。现在,linus依然不遗余力的改
地图能对真实世界进行模拟,是一种高度抽象化、概括化的模型。随着科学技术的不断提高,地图技术的发展也在飞速前进。地图符号作为地图的语言,能直观地表达地理事物和可视化展现
随着计算机的不断普及,互联网的快速发展,人们对传统的教学模式不再满意,而此时网络课程应运而生。传统教学模式以老师为主,老师和学生同时处在教室,老师主动向学生授课,学生则被动
World Wide Web(简称Web)自诞生起,其规模在短短十几年间呈指数级增长。由于Web的存在,人们可以方便得获得大量信息。但同时Web信息的海量性、复杂性、分布性以及非结构性,使人
云计算、移动互联网、物联网等新兴技术的快速发展促使数据的规模爆炸式的增长。丰富的数据来源和多样的数据结构使得半结构和非结构化的数据比重越来越大。大数据环境下充分
本文主要针对关联规则的隐私保持进行研究。首先介绍了隐私保持的相关概念,隐私保持和信息安全的区别,数据挖掘隐私保持的分类以及用于隐私保持的一些技术:数据转换、数据随机变
本文主要讨论通过对网络服务资源的监控和管理加强网络服务资源的可用性。网络服务资源管理的目标是对网络服务资源的状态进行监测和控制,使其能够提供高效,可靠的服务,网络服务