基于数字指纹的音频识别与认证研究

被引量 : 0次 | 上传用户:HBFQYD2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字音频指纹是指可以代表一段声音重要声学特征的基于内容的紧致数字签名,其最主要的应用包括进行未知音乐检索的数字音频识别技术和作为鲁棒数字签名进行音频完整性/真实性校验的数字音频认证技术。本文介绍了音频指纹技术的基本概念、性质和算法的基本框架,针对指纹在音频识别和音频认证中的应用,对现有的音频指纹算法进行了评价和比较。提出了采用小波包最优基分解作为数学工具,在此基础上计算各种基于最佳子树中小波包系数的统计量作为鲁棒音频指纹,并分别用于未知音乐检索和基于质量/内容音频软认证的三种算法。算法1采用音频信号每帧最优小波包系数能量与平均能量的比值作为音频指纹比特序列进行未知音乐识别。实验结果表明此类指纹在不同音乐之间具有明显的可区分性,并且在受到有损压缩、添加噪声、重采样等一般音频信号处理时与原始指纹仍具有很高的相似性,即对音频信号处理具有强鲁棒性。这说明即使在遭受较强失真的情况下,此种特征也完全可以用于未知音频片段的数据库检索。算法2分别采用上述能量比值特征和最优分解后每帧小波包系数标准差与平均标准差的比值作为音频指纹比特序列进行基于内容的音频软认证。实验结果表明这两类特征对常见的保持内容信号处理如MP3压缩、回声、均衡化、重采样、调幅、添加噪声等均具有强鲁棒性从而通过认证,而对局部替换、修改、删除、复制音频等恶意操作则完全脆弱并触发检测器使认证失败,同时还能较准确地定位被恶意篡改的位置。算法3采用每帧最优小波包系数代数和的符号即±1序列作为音频指纹用于基于质量的音频软认证。采用客观音频质量评价工具PEAQ(PerceptualEvaluation of Audio Quality)区分某一音频处理是否引起质量下降到临界点。实验发现除各种比特率下的MP3压缩均能保持很高PEAQ值,被视为保持质量操作而通过认证外,均衡化、变调、混响、加回声、时间尺度伸缩等其它引起音频特殊效果的音频处理均引起PEAQ值较大下降,在此种意义下被视为不可接受操作而使认证失败。
其他文献
传统社会学的制度研究曾对经济学和政治学产生了深厚的影响,并在当代兴起了经济学和政治学中的新制度主义思潮,也取得了辉煌成就。相反,以制度研究为起点的社会学在后来的演
作为音乐传播的媒介、著作权人和社会公众的连接纽带,录音制作者的贡献是不容置疑的。录音制作者权利的保护倍受国际社会的重视,并已成为各国知识产权保护的焦点之一。当前在
轿车电动天窗是轿车车身系统中最大的配套分总成,它具有采光性好、改善车内空气质量、提高汽车档次等优点,因此,天窗版的轿车越来越受到人们的青睐。但是,目前国内轿车天窗市
本论文首先对交流异步电机控制系统和非线性控制理论的发展做了比较详细的综述。并且针对解耦和线性化这两个非线性系统的经典的问题,引出了非线性系统微分几何理论在交流异
安然事件之后,“五大”会计师事务所所推崇和采用的风险导向审计模式遭到广泛质疑,国际审计和保证准则委员会对原来的审计风险准则作了重要修订,并于2003年10月发布了三个新国际
目前,大部分互感器产品的绝缘设计都采用传统的设计方法,设计的周期比较长,设计的产品质量较差。现代的设计方法将可靠性理论从设计阶段引入到产品中来,大大降低了设计、制造
目的:通过本研究,使更多的与溢乳这一症状有关的疾病被了解,以期引起大家对溢乳的广泛重视,最终使一些与溢乳症状相关的疾病能够被早发现、早治疗。方法:选取吉林大学中日联
税收征收成本是一个国家税收征收效率的重要指标。近年来,我国税收收入增长较快,但政府为取得税收收入付出的各类费用上升也很快。“高成本,低效率”已成为我国税收工作突出
在全球化浪潮汹涌澎湃,新经济的发展方兴未艾的背景下,城市作为具有独立利益的经济实体被推到了国际化地区竞争的最前沿。制定战略规划成为城市谋求发展,应对竞争的重要举措
流行语既是一种语言现象,又是一种文化现象,是词汇系统在动态发展过程中的具有阶段性特征的重要表现。对流行语的研究,有助于了解和把握社会历史的发展脉络,洞悉语言随社会变