面向基于内容多媒体应用的视频对象分割

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：yaozi303

【摘要】

：

随着互联网和多媒体技术的迅速发展，我们在每天的生活中都会接触到大量的图像和视频信息。图像和视频的压缩技术已经取得了巨大的成就，有效地解决了存储和传输的问题，目前的多媒

【作者】

：

刘志

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2005年期

【关键词】

：

视频对象分割多媒体对象跟踪算法区域合并算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网和多媒体技术的迅速发展，我们在每天的生活中都会接触到大量的图像和视频信息。图像和视频的压缩技术已经取得了巨大的成就，有效地解决了存储和传输的问题，目前的多媒体应用迫切需要的是基于内容的功能。为了有效地提供基于内容的功能，必须从视频场景中分割出有意义的视频对象，以获得视频内容的基于对象的表示。视频对象分割最初的研究动机是为了实现MPEG-4基于内容的编码功能，现在它已经成为支持任何一种基于内容的多媒体应用的关键技术，其中包括视频索引和检索、智能视频监控、人机交互以及视频编辑等应用。视频对象分割方法基本上可分为两类：即自动分割方法和半自动分割方法。在详细回顾已有方法的基础上，本文提出了一种更细化的分类标准，强调了视频对象跟踪算法在自动和半自动分割方法中的通用性。对于自动分割，本文提出了两种运动对象分割算法以及一种人脸对象分割算法。对于半自动分割，本文提出了一个交互式视频对象分割工具以及一种同样可用于自动分割中的视频对象跟踪算法。具体来说，本文的主要创新工作如下：(1)使用光流场的运动信息，提出了基于假设检验的运动对象分割算法。初始分割采用分水岭分割算法，接着根据颜色相似性进行区域合并；然后利用光流场估计和全局运动估计获得全局运动的残余误差；最后以各个区域的残余误差数据进行假设检验来确定运动区域，组合所有的运动区域来生成具有准确边缘的完整视频对象。 (2)在时空分割框架下提出了一种自动视频对象分割算法。时域分割采用了基于F检验的变化检测方法；针对空域分割提出了一种彩色图像的分裂合并算法；然后考虑以前帧分割出的运动对象的累积结果，进行时空分割结果的融合；最后提出了一种利用边缘信息来消除显露的背景区域的后处理方法。 (3)针对半自动分割的第一步，开发了一个交互式视频对象分割工具来方便用户定义感兴趣的视频对象。用户交互结合了画标记和区域选择这两种方式，所提出的快速种子区域合并算法用来从分割区域中提取出视频对象。灵活的用户交互方式和种子区域合并算法相互配合，最大程度上减少了用户交互的工作量。 (4)提出了一种双向投影的方法用于视频对象跟踪，它有机地结合了前向投影和后向投影各自的优点。前向投影用来在当前帧中粗略定位视频对象的边界，接着在其膨胀区域内进行实际的分水岭分割。然后在较小的搜索范围内只对一些分割区域进行后向投影，提高了跟踪的效率，而且在后向投影中融合了象素分类和区域分类，保证了跟踪的可靠性。所提出的双向投影方法不仅可用于半自动视频对象分割的第二步，也可作为一个独立的跟踪模块用于自动视频对象分割中。 (5)提出了一种基于二叉划分树的人脸分割算法。首先结合象素分类和分水岭分割的结果来获得肤色区域；然后利用谷底检测和熵阈值化的方法提取出脸部特征来修正肤色区域。为了从肤色区域中分割出人脸区域，提出了一种新的区域合并算法，在合并过程中考虑了相邻区域之间公用边界的影响，并用二叉划分树来表示整个区域合并过程。接着利用一系列描述人脸的几何特征和形状特征的模糊隶属度函数，给二叉划分树的每个结点赋值来表示该结点的人脸相似度。最后提出了一种在二叉划分树中的结点选择算法来完成人脸分割，它能够在无需任何假设的情况下准确地分割出人脸对象。

其他文献

CAN总线与PSD模块在中央信号屏装置中的实现

在电力继电保护系统中,继电保护设备给出的异常状态信息报文通常可分为两类:事故信息报文和预告信息报文。事故信息报文是指有关继电器开关的动作信息报文;预告信息报文是指继电保护设备发出的报警信息报文。为了能够在现场接收到此类异常状态信息报文,同时又为了方便现场工作人员能够及时、准确地掌握继电保护设备的运行状态,一般在现场安装有继电保护设备的配套装置——中央信号屏。以往的中央信号屏的设计方法采用的

学位

CAN总线PSD模块单片机USB协议驱动程序

新型数字涡街流量计的研究

在工业自动化中,任何控制系统都是从生产过程运行的信息测量开始的,过程变量的自动检测仪表是自动化系统革命的关键。和温度、压力一样,流量也是生产过程中的重要变量。涡街流量计以其自身的一系列优点已经成为流量测量仪表家庭中不可缺少的一员,在计量检测中发挥着越来越大的作用。本课题针对涡街流量计易受噪声干扰、现场测量精度不高、量程比有限等问题,采用数字信号处理的方法加以改进,得到准确的流速测量结果。本

学位

涡街流量计数字滤波器互相关FFTARM以太网

高级数据加密标准—Rijndael算法的研究与改进

自 20 世纪 70 年代以来一直广泛使用的“数据加密标准”(DES) 日益显出衰老的痕迹，而一种新的算法 -- Rijndael -- 正顺利地逐渐变成新标准。DES 算法是全世界最广泛使用的加

学位

网络安全高级加密标准Rijndael算法Square攻击分组密码理论

Internet环境下基于敏捷哲理的协同产品设计过程管理

21世纪，信息革命正在促使制造业朝着全球合作的方向发展。计算机和网络通信技术在改变信息传递方式的同时也改变着企业组织管理方式，敏捷制造、虚拟制造等新的制造模式应运而生

学位

协同设计过程管理敏捷哲理Internet

智能住宅小区的通信设计和软件开发

论文对住宅小区智能系统进行了总体设计,着重进行了通信系统设计和系统软件开发。所设计的系统主要运用于新建的中高档住宅小区,目的是运用信息技术为小区居民提供安全防范、

学位

小区智能化网络客户机/服务器

中间视觉下道路照明光源光视光效模型研究

当前,道路照明光源光视差、光效低,道路照明光源的光视光效的提高已成为国内外研究的热点。针对道路照明的人眼中间视觉条件,研究基于行车视觉的行为反应时间,构建人眼中间视

学位

中间视觉道路照明光源光视光效模型安全性节能性视觉功效法

陕西科技大学学位论文全文数据库的设计与实现

随着计算机软硬件技术的飞速发展，计算机被广泛应用到人类生活的各个领域，互联网的出现与流行、Web技术的发展、数据库技术以及面向对象技术等为建立网络数据库应用系统奠定了

学位

.NET学位论文数据库论文提交论文存放文档合成转换

基于复杂适应系统理论的实验金融系统研究

近年来，经典金融理论的传统范式的统治地位逐渐被动摇了，期望效用最大化理论和有效市场假说受到了来自行为金融学等新兴的金融理论强有力的挑战。行为金融学更加强调个体投资者

学位

实验金融学复杂适应系统证券交易市场投资者行为正则规则

基于MS Analysis Services的联机分析处理技术应用研究

随着科学技术的发展,人们对信息的获取、加工、处理的要求越来越高,决策支持系统应运而生。数据仓库和联机分析处理(OLAP)技术是两种新型的决策支持技术。数据仓库是一种数据

学位

数据库数据仓库OLAP决策支持

基于GPRS网络的无线POS设计与实现

本文的主要研究内容是基于GPRS 的无线传输技术,并且利用32 位嵌入式系统ARM 微处理器,和嵌入式Linux 平台,实现无线POS 的设计。本课题所涉及到的应用技术:GPRS 是目前的GSM

学位

无线POSGPRS嵌入式设计掉电保护

面向基于内容多媒体应用的视频对象分割

其他学术论文