论文部分内容阅读
该文以数字视频数据为基础,采用数据挖掘技术对基于内容的视频分类和检索进行研究.将这些实际问题抽象为视频数据的准备、基于完整视频特征的视频分类、基于镜头序列的视频分类、结合分类的视频检索四个子论题.在视频数据准备方面,从数据挖掘的角度,提出了一套系统的视频数据准备方法,包括视频数据的采集、分割、特征提取和数据预处理.首先,提出一个自动动态阈值选择的视频分割方法(VSUDT),它是一种简单而有效的象素域镜头检测方法,仅需对视频进行一趟扫描,根据视频局部特征动态选择高低两个阈值进行双重比较.实验显示VSUDT方法比传统的Twin Comparison法的效率和精度更高;其次,在视频分割过程中,提取了面向视频和面向镜头的两套视频特征,这些特征兼有静态和动态特征的特点;最后,根据视频分类挖掘的需要分别对这些特征进行数据预处理.在基于完整视频特征的视频分类方面,提出了一种结合决策树归纳和关联分类的视频分类方法,该方法利用完整视频特征进行视频分类.其过程是利用决策树分类和关联分类两种方法分别提取决策树分类规则集和分类关联规则集,然后采用规则集合并算法(C2S)合并两套规则集,形成一个新规则集.该方法利用决策树和关联分类的特点,摒弃它们的弱点.实验表明,结合决策树归纳和关联分类的视频分类方法能有效提高视频分类的精度.在基于镜头序列的视频分类方面,提出了一个基于序列模式的分类方法(SPAC)和分类序列规则(CSRs,Class Sequence Rules)的概念.SPAC方法将分类规则挖掘和序列模式挖掘相结合,采用了一个新颖的分类序列规则挖掘策略,为每个分类挖掘频繁序列模式,并将该模式转换为分类序列规则,然后使用规则匹配算法和平均CSR匹配置信度构建有效的序列数据分类器.实验表明,SPAC方法能有效提高视频分类的精度.在结合分类的视频检索方面,为了克服关键帧选取的不确定性和缩小搜索空间,提出了结合分类的视频检索方法,它以镜头为单位提取视频特征,在镜头特征的基础上进行检索.该方法利用基于序列模式的视频分类方法,形成分类视频特征数据库和视频分类规则库,在进行检索之前先对查询视频进行分类,然后在分类数据库中进行检索,以便缩小搜索空间.结合分类的视频检索方法使用两种视频检索方案,即保留镜头次序的检索和可变镜头数目的检索.实验表明,该方法能够有效提高视频检索的效率和精度.