论文部分内容阅读
随着信息技术的不断发展,产生了大量的视频数据。视频数据在时间上的连续性,使得其比文本、图像等数据蕴含有更多的信息。因此视频处理技术受到广泛的关注。此外,视频数据量较大,从视频中高效的提取出信息成为一个具有挑战性的课题,并具有深远的理论研究意义。作为视频处理技术中的一个重要的方向,视频人脸聚类技术有着广泛的应用,例如基于内容的检索、自动确定电影演员表和快速浏览与组织视频等。传统的视频人脸聚类是基于图片的聚类技术,只利用人脸的视觉特征来区分不同的人物。在视频中,由于人脸图片的角度、光线、表情、遮挡等问题的出现,使得只依靠视觉特征对人脸聚类的效果不甚理想。本文利用视频在时间上连续的特性,首先提取出一些人脸之间关系的先验信息,之后利用这些信息来增强聚类的效果。在视频中,有两种固有的先验信息,人脸Track内部的和人脸Track之间的,这两种信息分别看做是must-link和cannot-link约束。具体的来说,must-link约束信息来自Track内部;cannot-link约束信息来自两个相互交叠的Track,其中Track内部之间有出现在同一视频帧内的人脸。利用这些先验信息,本文提出了一种基于约束稀疏表达的视频人脸聚类(CS-VFC)方法。CS-VFC算法在聚类的两个阶段利用约束信息,包括表达阶段和聚类阶段。在表达阶段,本文使用约束的稀疏表达技术来获得人脸之间的关系。利用上述的约束信息,使稀疏表达更注重探索未知人脸之间的关系,从而获得更准确的人脸之间关系的表达。在谱聚类阶段,我们使用一种软约束的方式将must-link和cannot-link信息整合到谱聚类当中。使得聚类的结果尽量满足约束信息而不改变潜在的人脸之间的关系。为了验证提出的方法的有效性,本文在多个视频数据集上做了大量的实验,同时在多个指标上与常用的方法进行了比较,实验结果充分显示了本方法的有效性和可行性。