面向视频理解的视频表征模型及应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:chenhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频理解是研究视频图像并进行计算机解释,实现人类视觉理解外部世界的一门学科。其主要任务是对视频进行分割、识别,并进一步获取有用信息,最后再将这些有用信息与应用的语义环境进行关联。由于视频结构复杂、语义信息丰富,因此视频的理解一直是视频相关分析中的重点和难点。在目前检索、标注、分类等技术研究中,人们往往从视频/图像所描述的对象、场景或事件等高层次概念和语义上来建立对视频相似性的理解。然而,计算机对视频相似性的理解则是在诸如颜色、纹理、形状等底层特征的基础之上进行度量。由于人和计算机对视频相似性的判断依据存在差异,造成人所理解的“语义相似”与计算机所理解的“视觉相似”之间产生“语义鸿沟”。合理选择视频的属性特征是视频理解的关键步骤,也是后续各类应用研究的关键。简洁有效的视频表征不仅有利于视频的压缩存储,而且有利于视频的高效查找和管理。综上所述,如何根据视频的特有知识有效填补视频理解中存在的“语义鸿沟”,对视频的有效管理和分析应用具有重要的研究意义。本文旨在进一步缩小视频理解中存在的“语义鸿沟”,重点研究视频的有效表征及其在相关领域中的应用。首先,研究了基于全局特征的表征方法及应用;其次,基于局部特征提出一种多视角多层次并且融合语义信息的视频表征模型;最后针对特殊视频给出了融合领域知识的表征模型及其相关应用。本文的主要工作和创新之处在于以下几个方面:1.提出一种在压缩变换域中基于全局特征的视频帧加权表征模型,并在此基础上提出一种层次化(帧-镜头-视频)的相似性度量方式。此外,进一步探讨层次化度量模型在视频例子检索中的应用。2.提出一种多层次多视角的主题表征模型(Multi-Layer Multi-View TopicModel,mlmv-LDA)。针对全局特征在视频帧表征时的不足,进一步寻求面向视频图像局部特征的多表达域、多视角、多种特征层次下的解决途径,建立视频元数据与各种应用需求的桥梁,有效填补了计算机和人对视频理解时存在的“语义鸿沟”。提出的表征模型融合了建立在局部特征描述子之上的若干种中层特征以及高层特征,并结合主题模型中隐含狄利克雷分布(Latent Dirichlet Allocation LDA)来学习每个视频的隐含主题分布,以对底层视觉特征和高层语义特征进行有效融合。3.提出一种针对广告视频的带后验概率的主题表征模型(posterior probabilityinvolved in LDA,pp LDA)。针对特定视频的表征问题,本文以广告视频作为特定的研究对象,将广告视频中包含的品牌信息(Logo)和高层对象之间的共现概率信息整合到隐含狄利克雷分布(Latent Dirichelt Allocation,LDA)中进行学习,这是一种读特定视频领域知识和主题学习模型的有效融合。最后,还进一步探究了所提出的表征模型在分类中的应用。4.提出一种面向视频高层语义表征的多标签学习框(Directed ProbabilityLabel Graph,DPLG)。该学习框架主要针对含有特定对象或标记的视频对象,是以广告视频作为该类视频的典型代表,结合图理论构建起来的。DPLG充分考虑了视频中不同标签之间的相关性,解决了该类视频的标注问题
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着信息科学领域基于统计的自然语言处理技术和人文学科领域描述性语言学研究的发展,一些研究机构、企业和组织甚至个人都开发、建设和积累了大量不同规模的语料库。这些语
受大气湍流影响,平面波经大气传播后,振幅和相位将发生随机起伏,导致光强闪烁、波面畸变。当光进入光学系统后,光学系统自身装调误差、光学元件制造误差以及温度和重力等因素
介绍了如何使用Overture记谱软件完成五线谱的输入和打印,同时介绍了怎样将五线谱和WORD文本进行混排。使五线谱文件顺利插入文本文档中。
煤矿救援机器人的研究对煤矿救灾工作的顺利开展有着重要的现实意义,简要分析了煤矿救援机器人在环境建模方面的研究现状,针对煤矿事故发生后,救援蛇形机器人如何在恶劣的井
荆公新学是指北宋政治家、思想家、文学家王安石(1021-1086)的学术思想,涉及哲学范畴、伦理学范畴、政治学范畴。荆公新学是儒学发展中的重要一环,它与同时期的理学、洛学、濂学共同推动了儒学由汉学系统向宋学系统的转变,其心性论对于开启陆王心学亦有先功。王安石的诗文成就也毫不逊色于北宋诸家,其文列于“唐宋八大家”,其诗开创风貌独异的“荆公体”。然而,由于熙宁变法的政治影响,古往今来的学者对荆公新学及
为了能够在大量程范围内准确检测出涡流探头到曲面基体表面的距离,使用FEM-BEM程序进行数值计算并分析不同涡流线圈尺寸、曲面曲率大小、提离距离等因素对涡流信号的影响规律
本研究的目的在于考察主观幸福感的影响因素,并深入分析主观幸福感同个人成就与抱负之间的关系。首先,本研究编制了抱负水平问卷和成就水平问卷。其次,本研究选取学生、政府
自动文本分类(也称文本分类)一直都是互联网信息处理的研究热点。随着实际应用中类别体系的灵活性要求越来越高和细分类别数目的急剧增长,文本分类中标准语料库的自动构建就
数字图像的获取不可避免地会受噪声影响,因而去噪依然是图像处理领域的一个研究热点。图像去噪旨在排除噪声同时尽可能保持图像细节。为此,已有众多滤波器被设计。其中,Buade