基于内容的视频拷贝检测算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:ffgooo208w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和数字媒体的快速发展,存在于网络上的视频数据呈现爆炸式增长,如何进行有效的管理和版权保护已引起了人们的广泛关注。基于内容的视频拷贝检测(Content-Based Copy Detection,CBCD)作为其中的一种重要解决方法,已成为多媒体信息处理领域的研究热点之一。CBCD主要关注三方面的问题:准确性、鲁棒性和检测效率。因此,作为解决上述问题的关键核心,视频特征的选择以及视频序列的快速匹配引起了许多学者的关注。现有的拷贝检测算法主要是将视频描述为图像帧集合,通过比对图像帧之间的特征相似度来达到对视频相似度判断。一些图像相似度算法被直接推广到了视频拷贝检测中,但这些算法所用特征过于单一,难以应对实际情况中多种不同形式的拷贝攻击变化且过于关注视频某一帧的特性,未能充分考虑视频的时间特性,不能完全适用于CBCD;此外,由于在视频中图像帧的数量非常庞大并且随着视频时长急剧增长,这样就难以达到快速检测的目的。所以,对如何提取鲁棒性较强的视觉特征并进行快速、准确的检测的研究是十分必要的。因此,本文围绕CBCD中视频特征提取和检测效率两方面问题进行了探讨和分析,在现有算法基础上提出了基于多特征二级匹配的视频拷贝检测算法(Two-Level Feature Measure, TLFM)和融合时空信息视觉词汇的视频拷贝检测算法(Spatiotemporal Bag-of-Words, STBOW)。TLFM算法设计了由粗到精的二级检测框架。粗略检测阶段提取视频镜头颜色-空间直方图特征用于拷贝镜头检索,精确检测阶段则采用基于量化编码方式改进的时空组合特征进行最终验证。为实现快速检测,在粗略检测阶段采用FLANN特征近邻检索与“尽早停止”相结合的策略。实验结果表明本文算法检测效率明显提高,对于添加边框、高斯模糊、亮度变化等全局拷贝攻击变化具有鲁棒性,在确保较高查全率的基础上,查准率也可取得较好水平。STBOW算法首先将视频描述为镜头关键帧集合,然后在传统视觉词汇(Bag–of-Word, BOW)基础上提出基于线性投射、圆形投射以及尺度变换不变直方图的改进方法,将图像局部特征的空间几何信息融入传统BOW特征之中。与此同时,为充分利用视频时间信息,将TLFM算法中所提时间特征与改进的BOW相结合,共同构造融合时空信息的视觉词汇特征。实验结果表明本文算法对于平移、旋转、尺度变化等空间几何信息改变具有鲁棒性,在检测效率并未急剧增长情况下,查全率和查准率均有显著提高。
其他文献
随着人们在日常生活中对计算机软件的需求不断增长,计算机软件系统的规模和复杂度也在不断的攀升,而对大规模复杂系统的测试和维护等需求超出了目前的测试与维护技术,因此也就出
随着互联网的迅速发展,网络规模急剧增大,结构日趋复杂,大规模网络已经成为网络研究的热点。网络模拟能够研究复杂网络行为,评价尚未实施的网络协议,具有成本低,易使用、模拟真实性
随着互联网的迅速发展,各行业信息化程度不断提高,越来越多的信息积累在网络上,如何在浩瀚的信息中寻找到有用的信息,一直是领域研究的热点。本文的研究背景是陕西省教育厅专项科
随着论坛等互联网社区的蓬勃发展,越来越多用户参与到互联网的建设中来,向互联网贡献数据。这些数据中很大一部分是对人物和事件的评论,包含了用户的观点和态度。浏览这些信息能
近年来,基因调控网络一直是一个生物信息学中的热点问题。基因调控网络描述的是基因之间的相互调控关系,通过分析该网络,可以从中发现基因之间相互作用和协同工作的原理,并且
所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。共指消解是信息抽取中的一个重要子任务,在自然语言处理和信息检索的各个领域有着重要的应用。传统方法将
心脏的收缩和舒张为人体的血液循环提供动力,是人体的动力之源,然而心血管疾病一直威胁着人类的健康。由于临床医学对人体心脏的研究成本高、效率低,虚拟心脏的研究得以迅速发展
无线传感器网络(WSNs)由大量传感器节点组成,这些节点分布在一定的区域内,并且通过无线节点间的相互通信来组成自组织的网络。无线传感器网络的主要功能是环境监测和信息采集,并
现在人们已经进入了信息化时代,并且随着科技的发展,信息在人们平时的生产和生活中变得越来越重要。这些信息以不同的方式出现在我们的生活中,如何将这些信息加以良好的有效的利
实验教学评价的研究是提高实验教学质量,进行科学实验教学管理的重要保证。针对当前实验教学评价系统存在的问题,设计开发了高校实验教学评价系统。本文主要工作内容如下: