论文部分内容阅读
近些年来,由于社交网络,博客等以信息为中心的应用程序产生了海量的数据,信息提取和管理等话题获得广泛的关注。数据的形式可以是文本,图片,视频,或者任意两个或多个形式之间的组合。非结构化或无组织的数据是最简单的数据形式,它可以在任何应用场景中产生。因此,最近提出了语义技术。语义技术结合了本体与语义相关的方法,来提取和管理在网络上的多模态内容。本论文致力于利用语义技术实现两个热门的基于网络的应用,分别是网络视频自动分类和灾难管理。关于网络视频分类,采用文本信息会存在以下情况,例如文本有噪声,句意模糊或者信息丢失,因此本论文主要关注基于视觉内容来实现视频分类。研究的主要贡献如下。为了解决基于内容特征的网络视频分类问题,论文利用大规模多媒体概念本体(LSCOM)来提取图像或者视频中有用的视觉信息,然后利用语义相关性的方法,结合已提取的相关视觉信息,来确定视频的分类。该框架主要包括三部分:首先,训练了类别预测分类器(CNC),利用视觉特征来对网络视频进行分类。然后,为了提高分类性能,使用了 VIREO-374的概念分类器来提高CNC的性能。最后,为度量每个类中的各个概念,论文提出了一种增强Flickr上下文空间(FECS),即特定类别概念分类器(CSC)。再在关键帧级别中将CSC分类器和CNC分类器融合。最后,将由文本标签产生的上下文的类别预测分类器(CXC)与提高的CNC分类器结合,提高视频分类的性能。基于MCG-WEBV和CCV两个大规模数据集的实验表明,该框架提高了网络视频分类的性能。接下来,本论文用不同的方式解决了网络视频自动分类问题。首先我们利用了外部支持,创建了一个类别区分词的语义列表,然后利用语义相关性的方法将高级概念映射到类别区分词,以实现视频的分类。为了解决网络视频自动分类问题,论文提出了一个三步骤的框架。首先,阐述了基于内容的视频分类。作者先训练了类别分类器,然后通过谷歌距离(NGD)度量了每个视频的高级概念和归一化类别区分词(CDTs)之间的语义相关性。CDTs是在开放目录项目(ODP)和大型网络视频上构建的。接着,论文研究了基于上下文的视频分类。首先提出向量空间模型(VSM)来计算每个视频的文本特征与CDTs相似度,然后通过NGD来度量每个视频的文本特征与CDTs语义相关性。最后,结合内容和上下文特征的分类方法来提高网络视频分类的性能。该方案的有效性在大规模视频数据集上得到了验证。为了更有效的利用本体,本论文实现了另一个基于网络的应用——灾难管理系统。关于灾难管理系统,本论文从不同的在线资源研究了灾难领域,并且建立了一个灾难本体,用于自动从网络文件中提取灾难相关的文本信息。为了使灾难管理过程自动化,我们提出在语义灾难管理系统中对本体进行双重使用。首先,本体可以用作背景知识,用于发现和选择有效资源。其次,在本体实例化之后,他们可以作为支持决策制定过程的依据。利用语义技术,我们提出了灾难本体的概念,其包含灾难管理中灾难的固有性质、灾难引起的损失以及需要的服务等主要因素。在灾难网络文件上进行的实验表明,与传统的爬取相比,本体驱动的爬取在资源发现和选择方面更有效。