基于基音频率的哼唱式音乐检索系统的研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:louisvu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学技术快速发展,数字化设备大量普及,多媒体设备数量飞速增长的环境下,作为多媒体数据重要组成部分之一的音频数据,其信息量也在不断扩大。传统的基于文本的音频检索已经无法满足人们对于音乐检索的需要。因此找到一种更加快速有效的音频信息检索方法,已经成为目前亟待研究的一个重要课题。基于内容的音乐检索方式,从一个崭新的角度来辨义音乐信息,从音乐的幅度、频谱、旋律、音高和节奏等内在信息进行音乐的检索。哼唱音乐检索的核心技术就是哼唱音乐的特征提取和音乐旋律的近似匹配,其中旋律的特征表示,本文用的是音高和音长信息。这种基于哼唱的音乐检索在音乐的快速查询、歌手的训练以及帮助作曲家们自动记谱等方面都有很好的应用前景,有可能成为下一代音乐检索的核心技术之一。本文主要做了以下工作。首先分析了信号的基本预处理方法,包括小波去噪,预加重及加窗分帧等;然后对语音信号的时域、频域的基本特性进行描述,包括短时能量,自相关性及过零率等,再提出一种经过小波去噪和线性预测预处理之后,加权自相关函数和平均幅度差函数的算法来提取基音信息,最后验证了该方法能在精度较高的情况下提取出音频信号的基音频率;在此基础上介绍了传统的音乐检索匹配算法,再根据提取出的音符的音高和音长信息,提出一种基于音高差的隐马尔科夫模型再加权音长比的方法,来进行搜索匹配,最终得到最佳匹配音乐;最后本文设计了一个基于基音频率的音乐哼唱检索系统,经过实验验证该系统对于音乐片段的检索具有较高的准确性,并且对于噪声具有相对较好的鲁棒性。
其他文献
近年来,伴随着计算机技术的发展和普及,功能全面、易于操作的图像、视频编辑软件越来越受到人们的关注,因此对于日常工作、生活、娱乐所不可缺少的数字图像、视频资源的简单编辑
随着社会的不断发展,移动通信的用户在不断的增加,这与频带资源匮乏产生了巨大的矛盾。为了解决这个矛盾,人们在不断地探索,终于OFDM自适应技术的出现满足了人们的愿望,它既有抗多
2011年,我国具有自主知识产权的第二代信源编码标准AVS2(Audio Video Standard Ⅱ)的视频部分正式立项,标志着我国在视频编码领域的发展又进了一步。AVS2编码标准的编码压缩
精品课程网站是高等学校教学质量与教学改革工程的重要组成部分,是学生自主学习、师生教学互动、同学学习交流和实现远程教学的重要平台。精品课程网站作为学生补充知识的第二
随着无线传感网络(Wireless Multimedia Sensor Networks, WMSN)的发展以及智能手机的出现,无线化、移动化成为当前通讯发展的趋势和潮流。分布式视频编码(Distributed Video
随着信号处理技术的不断发展,越来越多基于变换域的方法被提出,这些方法的不同之处在于其变换的基函数不同。本文介绍了一种最近提出的变换技术——拉马努金傅里叶变换(RFT),
随着汽车数量的迅速增长和道路交通事故的频繁发生,如何减少交通事故、降低交通事故造成的损失成为人们关注的重点。行人作为道路交通的主要参与者,是道路交通事故中死伤率最高