基于熵的音乐声纹检索算法的研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:anying_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络多媒体技术的发展,数字音乐内容越来越丰富,如何不局限于文字检索,而采用基于内容的音乐检索方式从音乐库中找到所需的歌曲已成为一个研究热点。基于熵的音乐检索算法采用录音片段的形式,可以快速、准确的从音乐库中找到对应的歌曲信息,利用它可以对未知歌曲信息的音乐进行检索,这对于以后音乐的管理和版权保护等领域都具有重要的影响。本文对音乐检索涉及的基本概念和背景进行了介绍,重点研究了音乐的声纹提取和检索算法,并基于此设计实现了一系列对比实验。本文主要的研究工作包括以下几个方面:(1)对基于熵的音乐检索相关的理论知识进行了研究与分析,给出了检索系统的总体框架和综述。(2)针对音乐特征的概率分布无法已知的问题,给出了基于熵的非参数估计的声纹提取算法。在常见的失真和噪声环境下,通过与参数方法进行对比实验,显示出非参数方法可以更精确的描述音乐的概率分布,声纹鲁棒性更强。(3)在对常用的音乐检索方法进行研究和对比的基础上,提出了一种改进的基于索引的匹配检索算法。通过匹配实验可以看出,成功检索到目标歌曲的概率较大,且效率较高。(4)利用本文研究的声纹提取和检索算法,设计并实现了一个音乐仿真系统。结合使用经过软件处理和实际情况下的检索片段,取得了较好的检索效果。
其他文献
水声通信网络由于可以弥补传统海洋探测技术的不足,在海洋信息采集、环境监测、灾难预报、辅助导航、沿岸监视、水声反潜等民用、军事领域有诸多重要应用。然而,水声通信网络中
低密度奇偶校验码(Low-Density Parity-Check Codes,LDPC)是1962年由Gallager提出的具有稀疏校验矩阵的一种线性分组码。1993年D.J.C.Mackay和Neal等人发现了其性能接近香农
混沌现象广泛的存在于我们生活中,伴随着信息科学技术的蓬勃发展,在通信技术和信号处理方面对混沌动力学系统的应用研究更是逐渐加强,特别是在安全通信技术方面,具有着极其广
啁啾光纤光栅具有反射带宽宽、群时延渐变、体积小、插入损耗低、与光纤系统兼容等优点,这使啁啾光纤光栅在光纤通信及传感等领域有着独特的应用价值。然而,用制作光栅常用的相
随着现代通信技术的发展,无线移动通信越来越深入到人们的生活。无线移动通信经历了第一代和第二代的发展,完成了从模拟技术到数字技术的转变,当前的移动通信技术正在从第三代通
由于高速模数转换器件发展缓慢而且价格昂贵,极大地阻碍了信息获取的进程。周期性非均匀采样能够以较低的平均采样频率对已知频谱范围,而具体频谱位置未知的带通模拟信号进行
数学形态学作为一种非线性的图像处理与分析的工具,以严谨的数学理论基础和简单、优美的算法,成功并广泛地应用在图像处理和分析的各个领域。本文将图论与形态学结合起来,研究这
像素通信是一种无线光通信技术,其发送端将信息编码为一系列图片并在显示设备上依次呈现,接收端使用图像采集设备捕获包含信息的图片并解码恢复出原始信息。与传统射频无线通信
随着微电子技术、计算机技术和无线通信技术等不断进步,无线传感网络逐渐成为一种新型的应用网络。而节点定位技术是无线传感器网络的关键技术之一,对其研究具有非常重要的理
波达方向(DOA)估计是阵列处理中一个常见的任务。传统的多重信号分类(MUSIC)是基于搜索的方法且通常计算成本较高,特别是在联合方位角和俯仰角估计的应用中。在本文中,我们将