基于内容的大规模近似重复视频检索研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kunjian99_Gmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机和网络通信等技术的高速发展,Internet上的信息种类和数量与日俱增。大规模的基于内容的近似重复视频检索正变得越来越重要。很多方法已经被提出来去解决这个问题,但是它们主要集中在提高准确率上,而在大规模网络视频数据库的检索和实时检索方面性能一般。基于这种情况本文将研究重点主要放在对检索速度和准确率有重要影响的特征提取和数据库索引技术的研究上,以达到在大规模网络视频数据库中近似重复视频的实时检索。在视频索引关键技术概述中。视频数据是非结构化的数据,不同于文本等结构化的数据。这里从颜色特性、纹理特性、形状特性和区域目标等方面介绍视频数据。接着对视频索引技术进行概述。介绍了视频特征索引的相关概念和描述、基本的索引结构、索引模型等。其次,描述了视频特征提取和视频索引技术研究。这里提出了次序特征的提取方法,并引入了LBP(local binary pattern)模式,对次序特征做了进一步处理,将关键帧分成主区域和辅区域两个部分。主区域包含了关键帧的主要信息并且相对于辅区域不容易被污染。使得基于LBP的次序特征提取方法不但对颜色变化有很好的鲁棒性而且包含了视频特有的时间特性,视频的时间特性通过取某个关键帧后面的两个关键帧的主区域特征来实现。然后介绍了文本索引中表现优良的倒排索引方法,并结合直方图交集核心(histogramintersection kernel)把这种方法引入到视频索引中。最后利用快速直方图交集(fasthistogram intersection)的思想改进倒排索引的结构,这样减少了查询的对比操作,虽然总的时间数据量级没有提升,但是消耗的时间有一定的提升。系统实现部分,先介绍系统的整体架构,然后分别阐述了关键帧提取、特征提取、视频索引、查询等模块的实现方法和具体实现细节。最后,实验部分。为了实验这个系统的性能,在一个公开的网络视频库CC_WEB_VIDEO中(一万个视频左右)评估这个系统。在相同召回率的情况下比较几个典型算法和本文算法的准确率,并且从平均准确率,速度,存储消耗等方面比较几种算法。因为大规模视频数据库的建立是很困难的,所以这里只从理论上分析了百万级别的视频数据库中内存的消耗和在普遍的硬件条件下(1G内存)此近似重复视频检索系统的可能性。用本文提出的方法实现的系统,在同一个开放网络视频数据库中无论是准确率和速度都要好于其他几种方法,并且时间上可以达到实时的效果。
其他文献
Hopfield神经网络已经在广大领域得到了应用,但是单纯的人工神经网络只是对生物神经网络的简化、抽象和模拟以实现对人脑结构的模仿,这种模仿就目前来说还处于较低水平,为此科学
温室大棚作为现代化农业的应用之一,其环境监测普遍采用的是有线通信方式,有线通信方式中的信号传输虽然相对比较稳定,但复杂的布线和较高的成本不利于进一步提高温室的自动
随着我国加入WTO,国民经济不断发展,国内企业越来越认识到商标的重要性,并逐步将商标专利提升到企业战略的高度。目前一些依赖分类和文本标注方法的商标查询系统面对百万级以上
近些年来,随着Web服务广泛应用,Web服务数量的急剧增加,Web服务的发现变得越来越困难,如何在海量的Web中找到所需的内容显得尤为重要。  传统的Web服务是静态的服务,没有语义信
近年来,移动互联网技术发展迅猛,移动智能设备大量普及,大量线上服务从PC端转移到移动端。移动端服务的提供,给人类生活带来极大便利。身份认证是移动端产品使用中必要的步骤
随着电力和电子技术的不断发展,各种电力电子设备应用日益增多。这些设备的增加在方便人们日常工作与生活的同时也给电网带来了谐波污染。特别是那些具有非线性和冲击性特点
随着计算机网络的不断发展,人们在受益于网络的同时,网络系统的安全保护问题也越来越突出。现如今网络系统受到的攻击越来越普遍,攻击的手法也越来越复杂,网络安全加密技术例
随着互联网技术的迅猛发展和智能终端的快速普及,越来越多的用户在社交媒体平台针对各类事件发表自己的立场和看法。用户针对具体对象和事件的立场态度对商业机构与政府机关
随着网络测量技术的发展,网络测量工具越来越多。对于某些大型网络测量系统,需要在特定的网络中对网络测量设备进行控制,而目前商用测量设备所采用的通信控制协议不尽相同。为了
本文研究了基于SAP系统的GRC(公司治理、风险管理和合规审查)软件服务在功能、安全和性能上的需求,并引入了SaaS (Software as a Service,软件即服务)的设计模式。在此基础上