视频自动分割及语义提取若干关键技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:nieguangyi127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对视频数据的有效处理、浏览、检索和管理正伴随着视频数据的快速增长而成为亟待解决的现实问题。视频内容分析技术旨在将非结构化的视频数据结构化,并提取其中的语义内容,最终建立视频索引和检索等应用系统,提供给用户方便的视频内容获取方式,它综合了多媒体处理、模式识别、计算机视觉、图像理解等领域的知识,具有广阔的应用前景。本文按照视频内容分析的逻辑顺序,研究了镜头检测、场景分割、图像流和音频流中若干语义对象的提取及融合多模态对象实现视频中的众多语义事件检测等技术。主要创新和研究结果如下:   ⑴提出了基于运动补偿和自适应双阈值的镜头检测算法。在该算法中,融合了运动特征和图像特征。先是提取前后两帧图像中的分块运动矢量,然后对运动矢量进行运动补偿,在此基础上根据前后帧间的像素值不变点数计算自适应双阈值实现镜头的突变和渐变的检测。实验证实该算法不仅能够有效地检测出突变和渐变,而且算法适应于多种视频,具有一定的普适性,并且因为采用了运动补偿,所以对视频帧间的运动具有较强的鲁棒性。   ⑵分别以影视类视频和广告视频为研究对象,提出了两种场景分割算法。首先以影视类视频为研究对象,针对以往基于阈值聚类的场景检测算法中存在的需要设置经验阈值及聚类后得不到各类的类别中心的缺陷,提出了新颖的基于均值漂移聚类的场景检测算法。在该算法中,先是基于均值漂移,在滑动镜头窗内对各镜头聚类,并获得相应的聚类中心,然后根据电影视频场景的发展模式,计算两个镜头类之间的时序距离,接着基于时空关系进行场景检测,并且由相应的聚类中心获得场景关键帧,最后对场景过分割进行后续处理。实验证实该方法能快速聚类,并且能有效的检测出场景和场景关键帧。随后以广告视频为研究对象,结合视频的特色,先是对音频建立高斯混合模型,然后基于分割熵检测音频的跳变点,最后结合视频中的文本检测及音频跳变点实现广告单元边界的检测。实验证实算法具有一定的检测率。   ⑶以足球视频为研究对象,分别从图像流和音频流入手,提出了若干个基本语义对象提取的算法。精彩的射门事件发生在球门附近,球门的检测有助于射门事件的检测。结合球门的图像特征,提出了基于Top-Hat变换和支持向量机的球门检测算法。实验证实算法具有较高的查全率和查准率,并对图像模糊的视频具有很强的鲁棒性。回放的慢镜头对精彩事件具有定位语义作用。结合慢镜头回放前后的徽标镜头的特征,提出了一种基于徽标和规则的慢镜头回放检测算法。实验证实该算法不仅具有较高的查全率和查准率,而且所需的时间代价也较小。与图像特征相比,音频特征同样具有丰富的语义作用。在对隐马尔可夫模型进行系统描述的基础上,提出了基于连续隐马尔可夫模型的音频语义对象提取算法。实验证实了算法的有效性。   ⑷提出了基于离散隐马尔可夫模型和多模态融合的多事件检测算法。以足球视频为研究对象,首先基于连续隐马尔可夫模型提取音频语义对象,然后基于时间联系,将音频流与图像流融合,接着基于离散隐马尔可夫模型融合多模态对象实现多事件检测。实验证实了算法的有效性。
其他文献
TFT-LCD作为液晶平板显示器的一种,以其在亮度、对比度、功耗、寿命、体积等方面的优势迅速成为新世纪的主流产品,并将是全球经济增长的一个亮点。为了快速的获取TFT-LCD清晰
PWM电压源型逆变器是永磁同步电机伺服系统中的重要部件,其死区的设置避免了逆变器桥臂短路,但同时也增大了逆变器输出电流谐波,降低了伺服系统的性能。此外,目前伺服系统中广泛
近年来,随着电力电子技术、传感器技术、微型计算机技术以及控制理论的蓬勃发展,交流伺服控制技术有了极大的进步,逐步地取代了直流伺服系统,成为当今伺服控制的主流。而永磁同步
很多工业过程都带有明显的非线性特征,这使得这类过程的建模和控制比较困难,这个问题也一直是学术界和工业界关心的热点。建立有效实用的过程模型,是先进控制技术应用的瓶颈。本
足部关联着人体的五脏六腑和各个器官,被称为“人的第二心脏”。鞋类舒适度测量的研究,为设计符合人体生物力学分布的成鞋提供科学依据,同时,对人体生物力学研究、医学、体育
常微分方程的形成和发展与力学、天文学、物理学等密切相关,这使数学家们深信微分方程在认识自然和改造自然方面的巨大力量。现在,常微分方程在很多学科领域内有着重要的应用
飞行机构是舞台栅顶一种必备的机械装置,用于舞台表演,以此来增加舞台演出效果,也可以用于影视剧制作、大型秀场表演等。飞行机构按结构可分为轨道式和非轨道式控制系统,本课
随着经济和科技的发展,能源需求的增加,以及环境保护意识的增强,节能减排已成为科研计划中的重要研究项目,各项政策法规也在不断出台。当前,在道路照明应用中,主要采用大功率
两轮自平衡小车是一个典型的复杂系统,但其本身又不是非常复杂。其动力学系统具有多变量、非线性、强耦合、参数不确定等特性,其运动环境、控制任务复杂,在完成平衡控制的同
永磁同步电机(Permanent Magnet Synchronous Motor,简称PMSM)具有功率密度高、转动惯量小等优点,近年来在中小容量矢量调速控制系统中得到了广泛的应用。为了实现系统的高性能