基于镜头的高效视频拷贝检测技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:akgmtgdt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展,数字媒体的数量也急剧增加,随之而来的是一系列的版权纠纷问题。在拷贝检测应用方面,基于内容的拷贝检测具有更好的鲁棒性和更好的适用性,因而可以看作数字水印的替代技术。本文使用基于镜头的视频拷贝检测技术,运用文档检索领域的词袋模型对视频内容进行检测。首先根据镜头分割的实际情况,对分割算法得到的镜头进行一定的去除和合并,从而使得镜头的分割结果更加合理,同时减少索引数量并加快查找速度。然后对于各个镜头提取各关键帧的局部特征,对局部特征实验性的选取降维的维度,以求在保持其最高区分度的情况下尽量减小降维的后的维度。以这种降维方式产生词袋模型中的关键字,能够确保每个特征的对应的关键字的产生只依赖于自身的内容,增强了关键字产生的稳定性。某些特殊攻击以及镜头分割算法的缺陷的存在,可能会导致拷贝片段和原始片段的长度偏差较大,这样分割得到的镜头就会存在着长度相差较大却互为拷贝的情况。为了应对这种情况,在检测阶段,使用两种方法进行相似度度量。镜头分割结果大部分情况下是较为匹配的,这种情况下使用增大拷贝镜头间相似度与非拷贝镜头间相似度之间差别的度量方式,从而增大区分度,增强辨识能力。对于镜头长度相差较大但是又确实可能为拷贝的情况,本文使用能够减小镜头长度对相似度影响的方式来度量镜头间相似度,从而提高系统的查全率和查准率。实验结果显示,使用本文中的降维和视觉词产生方法,能够很好的表示视频的内容。同时,单独使用一个方式进行相似度度量时,系统已经能够达到很高的性能。另外,对于不可信的镜头间使用另一个方式进行二次判定能够使得系统在查全率和查准率上都有一定的提升。
其他文献
视频编解码一类的多媒体流计算不仅计算复杂度高,而且计算过程中需要进行密集数据访问。片上多级Cache可以缓解计算速度与数据存取速度之间的差距。但是,片上Cache空间通常非常
随着数据库技术和信息网络的快速发展,越来越多的数据被收集,发布和使用。一些基于互联网的企业也储存了很多相关的敏感隐私信息,这些信息一旦被泄漏,会给企业的发展带来严重的后
全文检索系统所面对的数据集通常是不断增长的大量文本集,为了及时处理新增的文档以满足用户的实时检索需求,高效的在线倒排索引更新策略显得尤为重要。现有的倒排索引更新策略
常见媒体类型包括文本、图形、音频和视频等,在越来越多的领域中人们不再满足于采取单一模态对事物进行描述而需要以多种媒体形式对事物进行描述或重现。以此为契机基于语义的
随着硬件技术的发展,嵌入式应用不断普及和深化。嵌入式软件的需求越来越大,复杂性也越来越高。在开发嵌入式软件的过程中,调试成为了不可或缺的重要阶段。嵌入式软件的调试时间
安全是铁路运输永恒的主题。铁路运输是危险品运输的主要方式之一。由于缺少对列车在途运输中各种状态的监测,当发生事故时不易被发现,对列车的安全运行和人们的生命财产安全
C语言是广泛使用的高级编程语言之一,其发展了30多年仍然有很强的生命力,由于其本身面向底层的特点,使得它存在可能被利用的安全漏洞。C程序漏洞有很大一部分是内存访问相关漏洞
虚拟化技术拥有良好的资源整合能力和安全隔离性,已在工业界得到广泛的运用。虽然分离驱动模型解决了多个虚拟机共享单一物理设备的问题,但是目前的虚拟中断只能静态的发送给虚
教育领域中无时无刻都在产生大量教育数据,与此同时这些教育数据中隐藏着大量的潜在的有用的价值,倘若我们能把“地大物博”的教育数据转化成有指导,有建设、有意义的科学分析来
随着移动智能终端的大规模普及和高速无线接入技术的快速发展,移动多媒体网络应用迅速兴起。与之相应地,移动终端上多媒体网络应用的能耗需求迅速增长。而移动终端固有的电池