论文部分内容阅读
寻找好的距离测度是模式识别和机器学习领域的一个重要问题,并且被广泛应用于图像与视频的检索、生物计量学、图像自动标注等许多方面。但是,按照人的思考方式衡量数据的相似程度,填补数据低层特征和高层语义之间的鸿沟仍然是极具挑战的课题。本文介绍了定义和学习距离测度的研究与发展现状,着重介绍了监督测度学习和协方差测度及其流形解释,并在以下几个方面做了探索性工作:1.在监督测度学习的基础上,提出了一种新的学习数据语义测度的框架。算法通过定义标注测量寻找数据的语义近邻,利用测度学习维持数据间的近邻关系,同时减少非语义近邻之间的相互影响。样本的低层特征空间和高层语义空间可以通过一个线性映射联系起来,且不需要关于数据分布或内在结构的先验知识。在训练样本数目不多的情况下,也可以得到好的结果。该算法可以作为预处理过程,嵌入到几乎所有的机器学习算法中。不仅可以用于分类和聚类问题,对回归问题也同样适用。2.基于图像块的协方差矩阵,提出了一种基于模板匹配识别视频中特定动作的方法。对缺乏训练样本,周围环境较复杂的实际监控视频的分析,取得了较好的结果。同样该协方差矩阵可以转化为特征向量,嵌入到绝大多数机器学习算法中。另一方面,在确定了事件发生区域的前提下,视频流形曲线可以用来近似运动轨迹,进而分析某些关键动作的起止帧。在FG_NET人脸数据库上的实验验证了我们提出算法的有效性。所学测度可以清晰地刻画出人的老化趋势。即使通过简单的kNN回归,也可以得到与目前最好算法相比拟的年龄估计结果;所提出的基于协方差测度的模板匹配方法在TRECVID2008异常事件检测竞赛中得到应用,在检测“指”(pointing)这一动作的单项中,取得了最好的检测结果。