融合时空梯度的视频显著目标检测及应用

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:Seasonbaby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著目标检测是利用计算机模拟人眼的视觉注意机制,在大量冗余的图像或视频数据中提取最重要的部分以便于后期的图像处理,如分割、缩放等。视频显著目标检测通过逐帧检测或者在图像显著目标检测基础上加入运动特征来实现,在背景复杂的情况下,通常无法快速准确地检测出显著目标。本文提出了一种融合时空梯度的视频显著性检测算法,将静态边缘和动态边缘结合得到时空梯度,并根据相邻帧的相似度自适应计算两帧融合的权值,得到运动显著图,融合运动显著图与静态图像显著图得到最终的显著图。论文的主要工作包括:首先,提出了利用时空梯度进行显著目标位置的粗定位。由于单一的静态边缘和运动信息均不能精确显著目标的边缘,本文提出基于相互一致性的自适应融合方式,将由边缘检测得到的静态边缘和由大位移运动光流得到的动态边缘进行融合得到时空梯度对显著目标进行粗定位,可以有效去除背景中的无效边缘信息并且提取出显著目标轮廓。其次,针对现有视频显著性算法中忽略时空一致的问题,提出时间一致性方法。自然视频中连续视频帧具有时间相关性,即目标/背景区域的显著值是沿时间轴平稳变化而不是急剧变化,本文通过相邻帧间的约束可以进一步对粗定位的显著目标细化边缘和去除背景噪声得到运动显著图。最后,本文提出自适应确定融合权重的方法,将运动显著图与静态图像显著目标图进行自适应融合,去除了静态显著图中多余的背景噪声,避免运动显著图中的显著目标缺失,使得到的视频显著目标图更接近真值图。将本文显著性检测图应用于视频缩放和视频分割中。对内容感知的视频缩放技术,以本文提取的视频显著目标图作为重要度图进行视频缩放实验;以视频显著目标图中的显著区域作为图像前景目标先验,进行视频前景背景分割。将本文算法在两个公开的数据集ViSal和SegtrackV2上与九种典型的图像、视频显著目标检测算法进行对比,采用主观评价以及PR曲线、F值、平均绝对误差(MAE,Mean Absolute Error)三种客观评价方法同时对其进行评价,实验结果表明本文所提出的算法能更快速准确地提取出视频序列中的显著目标,尤其在背景复杂时有更加明显的优势。在基于内容感知的视频缩放技术以及视频分割技术的应用中,本文算法较其它四种视频显著性检测模型的结果更具有普适性和优越性。
其他文献
洪浩尔舒特凹陷是二连盆地富油老凹陷之一,但凹陷油气资源勘探潜力巨大。针对该凹陷烃源灶定量表征不精细和灶藏关系不明确的问题,本文将从烃源灶评价、烃源岩热演化历史、灶
北二东区储层岩石是一套白垩纪陆相湖盆沉积的碎屑岩,岩石成分以长石—石英砂为主,岩石以细砂为主,油层压实程度差,油层较厚,属于高孔、高渗、中高黏度油藏。研究区目前已进
墓地殡葬习俗在我国由来已久,“入土为安”的传统观念有着很深的社会伦理根基,但由于我国人口基数庞大及随着现阶段人口老龄化速度的加快、国家城市化建设的不断推进,使得近
图像显著性检测是利用计算机模拟人类的注意机制从图像中提取出感兴趣的区域,用于后续的图像处理,该技术广泛应用于目标识别、图像检索、图像分割、基于内容感知的图像压缩等
在图像分割过程中,通常一幅图像会被分成前景(目标区域)和背景(非目标区域)两部分,对图像分割所得的目标区域进行特征提取和分析有助于我们对图像所表示的物体的本质有更好地认识并提供相应的行为方案.本文针对传统的总变分(Total Variation,TV)图像前后景分割模型在分割过程中易产生阶梯效应和丢失图像细节信息而导致分割得到的图像质量下降的问题,提出了总广义变分(Total Generalize
无意识思维是指当个体的注意指向其它无关对象时所发生的与任务或目标相关的认知或情感思维过程。研究发现,与有意识思维相比,无意识思维在创造性问题解决、说服、道德判断、人才选拔、决策等方面均存在优势效应。但是,最近研究表明,分心任务与实验任务的相似性会影响无意识思维效应。具体来说,当分心任务与实验任务相似时会阻碍无意识思维的加工,而分心任务与实验任务不相似时则有利于无意识思维的加工。但是,由于该研究的实
近年来,因脊髓损伤和中风等疾病导致肢体运动功能障碍的患者日益增多,运动康复治疗对其运动功能的恢复十分重要。康复机器人可以高精度辅助患者进行康复运动,但是对于大部分失去运动能力的人,一般只能实现被动的辅助动作,对于患者提高肌肉活性程度有限。功能性电刺激技术主要利用低频弱电流脉冲刺激瘫痪患者的肌肉使其收缩,以替代或矫正肢体已丧失的功能。然而由于人体肌肉骨骼系统是一个高度非线性的时变系统,加之肌肉疲劳等
图像分类主要根据图像的特征属性对图像进行自动分类.受光照、尺度变化等因素的影响,如何提取图像特征并对图像进行有效表示成为图像分类的主要研究问题.稀疏编码是一种高效的特征表示方法,它通过寻找一组超完备字典基向量,求得特征基于字典基的重建系数,在图像分类上取得了较好的性能.然而,稀疏编码的研究仍存在不足之处,比如忽略了字典基之间的群效应,欧氏距离不能很好地度量特征向量与字典基之间的距离,以及Lapla
人工智能时代不断进步,使得计算机在很多方面能够做到和人类一样思维的操作,大幅度提升了办事的效率,正因为科技的进步,图像检索方式也在不断进步,人们对于图像检索的需求也日渐增多,因此,如何在大规模的图像检索任务中提升速度和精度成为图像检索工程中非常关键的任务。针对如何提升大规模图像检索任务的精度和效率的问题,提出了一种结合哈希算法和生成对抗网络算法的图像检索模型。该模型在无监督条件下进行,即不利用图像
随着人们对通信质量和通信速率的需求日益增加,多输入多输出(Multiple Input Multiple Output,MIMO)技术成为4G(the 4th Generation)和5G(the 5th Generation)通信的核心技术之一。近年来基站天线多采用双极化MIMO天线的形式,主要是利用其分集增益和复用增益来提高信道容量、降低多径衰落、提高信噪比,从而提高通信质量和通信速率。天线数