基于时空CNN特征的视频拷贝检测算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:boypoe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的视频拷贝检测算法没能将视频的空间域特征与时间域特征有效结合起来,从而在检测性能上仍有很大的提升空间。虽然一些基于卷积神经网络(Converlutional Neural Network,CNN)特征的最新算法在检测性能上超过了传统的基于手工特征的检测算法,但由于没能处理好视频空间域特征与时间域特征之间的关系,其检测性能仍然不高。鉴于上述不足,本文提出了两种基于时空域特征的视频拷贝检测方案。1)提出了一种基于时空域CNN特征的视频拷贝检测算法为了解决现有的视频拷贝检测方法存在的检测准确率低,检测效率不高的问题,本文提出一种新颖的视频拷贝检测算法。由于视频数据量通常很大,为了减少数据计算复杂度,本算法首先对视频进行等间隔采样处理。然后利用CNN网络对采样视频帧提取紧致的空间域特征。为了更加精确地描述视频,本算法对CNN输出的卷积特征图计算质心并编码得到时间域特征。该特征作为空间域特征的补充,可以弥补空间域特征描述能力的不足。在拷贝检测时,首先使用空间域特征筛选出可疑的拷贝视频,然后利用时间域特征过滤错误的匹配结果,得到最终的拷贝检测结果。该方法由于使用时间域特征进行后验证来去除错误的匹配结果,因此检测准确率较高。并且,CNN特征的使用使得提取的特征足够紧凑,从而在提高检测准确率的同时,加快了拷贝检测速度。2)提出了一种基于时空视觉词和分层索引的视频拷贝检测算法为了进一步提高现有视频拷贝检测算法的性能,本文提出了一种基于时空域视觉词和分层倒排索引的视频拷贝检测算法。该算法从采样后的视频帧中提取更加鲁棒的SURF描述子(Speed-Up Robust Features,加速鲁棒特征)作为空间域特征,并通过词袋模型对SURF特征进行量化得到空间域视觉词。针对上一算法中生成的质心不稳定的问题,本算法中利用SURF点的稳定性并对视频帧间的SURF点位移信息进行编码,得到多层时间域视觉词。为了实现高效检测,将时空域视觉词保存在本算法提出的基于多层视觉词的倒排索引结构中。在拷贝检测阶段,为了区分时空视觉词对视频描述能力的不同,采用分层计算的方式获得时空视觉词各层间的匹配相似度。最终通过相似度融合计算得到两视频间的相似度,进而判断出当前视频是否是原视频的拷贝版本。大量的实验结果验证了本算法在检测准确率和检测效率上的优异性能。
其他文献
在全球变暖的大背景下,全球范围内的降水增加,极端降水作为降水的特殊情况,其频率和强度也不断增加,容易引发洪涝、干旱灾害及滑坡、泥石流等次生灾害,破坏生态平衡,威胁人们
在实际的控制系统中,广义系统的形式越来越普遍,其中变常导数项矩阵的现象时常存在。自从模糊控制被提出以来,T-S模糊系统建模的方式就已经被证明是一个万能的近似模型,这一
钢铁工业是中国国民经济的基础产业。钢铁工业不仅是技术、资金、资源、能源、劳动力密集型产业,同时也是影响最大、拥有严重过剩产能的产业之一。于2012年-2015年期间,钢铁
人工智能的发展已经取得丰硕的成果,给我们生活带来方便的同时,也给我们的生活带来了消极影响,而深入分析人工智能给我们带来的影响,特别是负面影响,我们发现,设计的缺陷是人
随着信息技术的快速迭代和飞速发展,云计算、云存储、大数据、物联网等新技术应运而生,在金融、医疗、科研、军事等领域得到广泛的应用。越来越多的互联网用户把自己的信息和
地球上的海洋面积占陆地面积的两倍以上,拥有丰富的渔业生物、矿产和油气等资源。随着人类海洋活动的日益频密,对海洋的研究与开发利用引起了越来越多学者的关注。水下物理信
在铝用阳极生产过程中,分为煅烧,组装,焙烧,成型四个工序,其中焙烧阶段对阳极质量的影响最大,因此对焙烧过程的研究具有重大意义。在焙烧生产过程中,会积累大量的与时间相关
在实际工程应用中,外源干扰通常含有不确定性,但在含有不确定性干扰的运行环境下,受控系统无法渐近跟踪设定的目标值。如果针对存在于设备运行环境中的不确定性干扰,更改控制
随着我国经济大力发展,国民收入有了显著的提升,汽车行业也在改革开放近30年来得到了大力的发展,如今已经成为国家经济支柱中重要的一块,中国市场也在早期国家通过市场换技术
随着互联网的发展,社交软件已经成为人们生活必不可少的一部分,人们可以用社交网站或社交软件进行普通日常交流、学术交流和投票选举等等活动。在线社会网络的大量增长,这为