论文部分内容阅读
近年来,随着视频数据的增加,基于语义的视频检索成为一个研究热点。在推动高效的视频检索和视频挖掘的过程中,自动的语义概念检测扮演重要的角色,因为它是跨越低层特征和高层人类解释之间鸿沟的桥梁。语义概念检测,就是发现匹配如户外、人脸、办公室等这些特别概念的视频镜头。于此同时,概念格理论和数据挖掘技术的发展,为视频语义检测的发展提供了强有力的理论支持和方法支持。
本文首先综述课题的研究背景,并分析目前国内外已提出的主流视频语义概念检测方法。在综合分析了数据挖掘技术和概念格理论的基础上,本文提出了以负样本精简的概念格规则提取算法,基于k-均值的中间层语义生成方法和基于概念格的视频语义概念检测方法,具体内容如下:
(1)提出了以负样本精简的概念格规则提取算法。该算法首先使用Godin增量算法构建概念格,利用支持度门限获得该概念格的初始规则集合,然后充分考虑样本数据中负样本所蕴含的丰富信息,利用设计的规则容忍度和训练数据中的负样本对初始规则进行精简,得到一个更为简洁和合理的概念格规则集合。
(2)提出了基于k-均值的中间层语义生成方法。由于低层特征和高层语义之间存在语义鸿沟而导致直接从低层特征理解视频内容是困难的,本文提出了基于k-均值的中间层语义生成方法。该方法首先使用k-均值聚类算法将每维特征分为3个聚类,得到每个聚类的最大值和最小值,再重新计算聚类阈值,最后根据新的阈值将低层特征矩阵映射到一个低层语义特征矩阵,获得中间层语义。
(3)提出了基于概念格的视频语义概念检测方法。该方法是概念格数据挖掘技术在视频语义检测上的一个应用。该方法结合了所提出的以负样本精简的概念格规则提取算法和基于k-均值的中间层语义生成方法,在提取视频镜头中颜色、纹理和形状等低层特征的基础上,先将低层特征矩阵通过变换映射到低层语义特征矩阵,然后以该低层语义特征矩阵为形式背景构造概念格,并提取概念格规则作为视频语义概念的分类规则,最后使用所提取的规则检测视频库中镜头所包含的语义概念。
(4)采用面向对象的设计方法,设计并实现了基于概念格的视频语义概念检测原型系统,并从实验角度验证了上述方法的有效性。