论文部分内容阅读
如今,伴随着科学技术的高速发展,互联网信息的数量以及种类日益增加,信息爆炸与融合正在引领互联网的新时代。因此,大规模近重复视频检测正变得越来越重要。近重复视频检测是视频检索领域的一项热门研究,在视频监控和跟踪、版权违规检测、视频数据库清理以及视频推荐等方面皆具有深远的发展前景。在大规模视频数据库中,针对近重复视频检测的应用要求,本文研究了具有高准确率和快速的近重复视频检测方法,主要工作如下:1.提出了基于Toeplitz矩阵的核偏最小二乘算法(Toeplitz based Kernel Partial Least Squares,TKPLS)。TKPLS算法在偏最小二乘算法基础上使用核化手段将数据向高维空间投影,以对视频内以及视频间的非线性关系进行描述。同时,为了解决核化带来的高维问题,在核偏最小二乘算法基础上引入Toeplitz循环矩阵,并利用快速傅立叶变换FFT的性质优化核化运算,使核化运算变为逐元素处理。TKPLS算法利用关联分析工具中的偏最小二乘算法为核心进行近重复视频检测,能够有效挖掘视频间的关联关系,既有效地增强了对视频的非线性描述,也优化了近重复视频检测的效率。在CC_WEB_VIDEO数据集上的仿真对比实验的结果表明TKPLS算法在准确度以及速度方面比BCS、SE、SSBelt、CCA算法能获得更好的近重复视频检测效果。2.提出了基于Toeplitz矩阵的多核偏最小二乘算法(Toeplitz based Multiple Kernel Partial Least Squares,MTKPLS)。MTKPLS算法将多核学习(Multiple Kernel Learning,MKL)的思想运用在已有近重复视频检测算法TKPLS上,通过引入多核权重对多个核函数进行线性组合,将单核模型转化为多核模型。多核权重通过学习自动适应,自然得解决了核函数对核参数的敏感性。同时,在多核映射的背景下,高维空间成为由多个特征空间组合而成的组合希尔伯特映射空间,更有效地利用了各种核函数映射能力。在CC_WEB_VIDEO数据集上的仿真对比实验的结果表明MTKPLS算法在准确度以及速度方面比BCS、SE、SSBelt、CCA、TKPLS算法更具有高效性。3.设计并实现了一个以MTKPLS算法为核心基础的近重复视频检测系统。该系统分为用户管理模块和近重复视频检测模块,其系统运行测试结果表明该近重复视频检测系统构建了友好的用户界面,实现了近重复视频检测功能,验证了本文所提方法的可用性。