基于音频的多媒体文件重复性检测

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:woai6672690
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“云存储”、“大数据”时代的到来,网络数据量成井喷式增长,在每天以不可思议的速度增长的网络数据中,音视频数据占据了很大的比例。这些网络音视频数据大都存在重复的现象,重复的多媒体文件给音视频网站的管理带来了很多难题,而解决这些难题仅仅依靠人力是几乎无法完成的,因此对多媒体文件重复性检测的研究具有非常重要的意义。目前对多媒体文件的重复性检测的研究主要分为基于文字描述、基于图像和基于音频的重复性检测。基于文字描述的方法过于主观性,对于恶意删改的文件无法检测;基于图像的方法无法对纯音频文件进行检测,并且其检测速度慢,准确率较低无法满足现实要求。因此,本文从音频入手,研究基于音频的多媒体文件重复性检测的方法。本文主要完成了以下工作:首先,本文研究了音频的特征表示方法。本文从目前研究经常使用的声学特征层出发,对时域特征、频域特征和倒谱域特征进行了介绍,并重点研究了倒谱域的Mel频率倒谱系数(MFCC)和频域的音级轮廓(PCP)特征以及在两者基础上发展而来的美尔音级轮廓(MPCP)特征的原理和计算方法。除此之外,本文提出了新的融合特征(MP)。其次,本文研究了基于model-free音频文件重复性检测的过程,包括多媒体文件格式统一化处理、特征表示、滑动窗口、交叉递归图和重复性判定。格式统一化处理是从多媒体文件中提取音频数据并进行解码。特征表示即是提取音频的四个特征来表示音频数据。滑动窗口是对于多媒体文件不等长的情况使用滑动策略。交叉递归图是以二维图的形式来分析两段音频特征的相似性。重复性判定是通过交叉递归图定量分析两段音频特征之间的相似度,进而通过与阈值比较判定两个多媒体文件是否重复。本文分别比较了四个音频特征(MFCC、PCP、MPCP、MP)的实验性能,并且通过实验发现,基于model-free音频文件重复性检测系统具有不错的检测准确率。最后,本文研究了基于model-based音频文件重复性检测的过程,包括多媒体文件格式统一化处理、特征表示、滑动窗口、交叉递归图、基于交叉递归图的特征向量提取、Max Pooling和支持向量机(SVM)模型。本系统将重复性检测转化为二分类的问题,进而使用SVM模型。通过实验发现,基于SVM模型的音频文件重复性检测系统具有更出色的表现。
其他文献
近年来,国家为规范房地产行业的发展,不断从金融、财税、土地各方面进行宏观调控,在此背景下,中小型房地产企业的生存空间再度被压缩。因此,中小型房地产企业只有树立正确的财务风险观,建立科学合理的财务风险管理制度,才能在激烈的市场环境中健康发展。鉴于此,本文以LQ房地产开发公司为例,对财务风险管理问题进行深入研究。房地产行业属于典型的资金密集型,高杠杆、高投入、高风险,资金回收期长和资产变现能力差。针对
随着网络中的信息资源不断地积累和扩充,用户越来越难以搜集到自己所需要的数据。推荐系统缓解了信息过载问题,有效地挖掘信息资源,并主动推送给用户。目前推荐系统中应用最
本文以当代西方最重要的马克思主义思想家詹姆逊的理论为出发点,通过阐释和研究他的新马克思主义思想,能够全面了解西方马克思主义的重要思潮与流派,体现马克思主义的不可超
由于投资者负面偏好的存在,内部控制缺陷一旦披露将会招致一定的负面后果,这将对股权质押后以稳定股价为目的的控股股东产生极大的影响。尤其在当前股市整体处于低谷状态、控股股东股权质押的平仓风险更为严重、控制权转移风险大大加强、企业发展前景更加不确定的背景下,为了稳定股价、防止控制权的转移,上市公司是否会刻意隐藏企业内部实际存在的内部控制缺陷?作为影响公司决策重要的内外部因素,股权制衡和市场化水平是否会在
人脸识别由于其广阔的应用前景和重大的学术价值,在模式识别和机器视觉领域已成为一个活跃的研究方向。如何高效从数据中提取有辨识性特征,然后基于这些特征进行分类识别是人
在我国北方寒冷地区,沥青路面的低温开裂现象十分普遍。当裂缝在气温变化、雨水和荷载的共同作用下继续发展,路段的强度和稳定性都会被削弱,可能造成巨大的经济损失。因此,对沥青路面的低温抗裂性能和使用寿命提出了更高的要求。本文针对河北省寒冷地区高速公路沥青路面的低温抗裂性能进行研究。首先,对河北省寒冷地区高速公路的裂缝病害进行调研,并结合调研路段的气候环境变化规律,建立环境特征变化模型。根据此模型可知,该
随着信息技术的不断发展,大量数据被如医疗系统、社交平台等机构所收集与处理,对这些数据的进一步分析与发布,能够给人们带来许多便利,同时对科学研究起着重要的作用。然而,
在人们生活越来越离不开网络的时代,网络安全势必将成为人们关注的重点。防火墙作为网络攻防的第一个主战场,无论是攻方还是防方都会在该领域深入研究。各大防火墙公司开发出
目的:相关研究表明大剂量化疗联合自体造血干细胞移植(HDC/ASCR)可显著改善高危神经母细胞瘤(NB)患儿预后,双次HDC/ASCR或可进一步提高患儿无事件生存(EFS)率,但患儿是否能耐受其毒副作用尚不明确,且不同HDC方案相关毒副作用不一。国内目前关于HDC/ASCR治疗高危NB的报道相对较少,且尚无对比单次与双次HDC/ASCR的文献报道,本文初步探讨单次及双次HDC/ASCR治疗高危NB
“无论从东北地区看,还是从全国发展来看,实现东北老工业基地振兴都具有重要意义”①。作为新中国工业的摇篮和我国重要工业、农业基地,东北地区的全面振兴关系国家发展全局,