抗线性速度变化的鲁棒音频指纹的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:jxc678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于数字化及互联网的发展,网络上出现了海量的音频多媒体信息,使得手工选取某首或特定音频内容变得很不可能。这促使以使用计算机自动对音乐内容进行识别的数字音频指纹技术的诞生,并成为近年来的研究及开发热点。本文对飞利浦研究院开发出的基于音频内容特征的鲁棒音频指纹系统进行了研究并提出了改进算法,论文的主要内容包括: 1.分析并验证了飞利浦音频指纹算法的鲁棒性。我们发现飞利浦音频指纹算法所生成的音频指纹对线性速度变化的抵抗能力较差,虽然两种改进算法对其进行了改善,但改善能力相当有限。造成这种结果的关键原因在于线性速度变化使得提取出的音频指纹在时间轴方向上出现了较大的对不齐现象,并且造成了指纹提取域——频域的拉伸变化,使指纹在频域轴方向上也了产生平移。 2.提出一种采用基频归一化的鲁棒音频指纹算法。该算法的创新点在于提取音频指纹之前先对音频的每一帧进行基频识别,并利用该基频对提取域进行归一化,我们证明了该归一化频域在线性速度变化下的不变性。同时叠加基频前后不相关的两段来生成指纹,以保证系统在不同音频之间指纹的区分性。我们通过比较音频指纹之间的误码率对音频进行识别。试验结果说明,本文算法在没有明显降低音频指纹系统区分性要求的前提下,使其对抗线性速度变化的鲁棒性有了较大改善。
其他文献
离线文字笔迹鉴别技术是依据文字笔迹对书写人身份进行判别的一项技术,随着应用领域的不断扩展,离线文字笔迹鉴别技术已经成为计算机视觉和模式识别领域一个十分活跃的研究课
视频监控系统在国民经济和国防建设中发挥着重要作用,广泛应用在保安、智能交通、智能武器等诸多领域。本文针对实际监控系统中难以兼顾可靠性与实时性的缺点,着重讨论和研究
电力线通信(Power Line Communication)简称PLC技术,它利用广泛存在的电力线作为传输媒介,传输数据、图像、语音以及其他多媒体信号的一种通信方式。电力线网络不需要重新布线、具有分布范围广泛、接入方便灵活等一系列优点,被认为是提供宽带网络接入解决方案最具竞争力的技术之一。然而电力线信道的各种特性提高了通信的难度,阻碍了其正常发展,作为能够有效减小电力线信道各种不良影响的理想调制
随着人们对通信容量需求的持续增大,而单模光纤传输系统容量始终无法突破它固有的香农极限,单模光纤已无法满足通信系统需求。为了使通信系统容量进一步提高,基于少模光纤的
近年来,随着互联网传输技术和多媒体技术不断发展,基于这些技术的各种应用越来越普遍。远程网络视频监控就是其中一个得到充分发展的应用,该应用取代了原始的人工现场监视,从
目前在油田测井作业中,工人采用在井口听爆破声音和用手触摸油管壁感觉振动判断射孔弹是否起爆,通过将射孔器提出地面数弹孔计算射孔数,这种方法是十分落后的。经常会发生因
无线通信技术是现代化科学技术的研究热点之一。由于无线媒介的开放特性和终端的移动特性,在通信系统中,信息传输的安全性成为越来越重要的问题,因而得到了越来越广泛的关注。为
相对于传统的干涉仪技术,阵列测向技术的优点就是可以同时处理多个信号,而分辨率则成为阵列处理多信号的重要指标,提高阵列测向算法的分辨率也成为阵列信号处理的迫切需求,利
随着互联网技术的发展,网络信息及上网用户数呈爆炸式增长,导致网络流量剧增,网络面临链路拥塞等问题。缓存技术是解决这些问题的主要措施,而缓存替换算法一直是提高缓存系统
翻车机是一种非常专业化的散状物料卸料系统,它用于火车装载的散状物料的翻卸,对其运行状态监测与故障诊断已成为热点课题。遵循“以先进的预知维护取代以时间为基础的预防性