多媒体内容分析中的语义距离测度学习及应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:fuzhuyuansu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
寻找好的距离测度是模式识别和机器学习领域的一个重要问题,并且被广泛应用于图像与视频的检索、生物计量学、图像自动标注等许多方面。但是,按照人的思考方式衡量数据的相似程度,填补数据低层特征和高层语义之间的鸿沟仍然是极具挑战的课题。本文介绍了定义和学习距离测度的研究与发展现状,着重介绍了监督测度学习和协方差测度及其流形解释,并在以下几个方面做了探索性工作:1.在监督测度学习的基础上,提出了一种新的学习数据语义测度的框架。算法通过定义标注测量寻找数据的语义近邻,利用测度学习维持数据间的近邻关系,同时减少非语义近邻之间的相互影响。样本的低层特征空间和高层语义空间可以通过一个线性映射联系起来,且不需要关于数据分布或内在结构的先验知识。在训练样本数目不多的情况下,也可以得到好的结果。该算法可以作为预处理过程,嵌入到几乎所有的机器学习算法中。不仅可以用于分类和聚类问题,对回归问题也同样适用。2.基于图像块的协方差矩阵,提出了一种基于模板匹配识别视频中特定动作的方法。对缺乏训练样本,周围环境较复杂的实际监控视频的分析,取得了较好的结果。同样该协方差矩阵可以转化为特征向量,嵌入到绝大多数机器学习算法中。另一方面,在确定了事件发生区域的前提下,视频流形曲线可以用来近似运动轨迹,进而分析某些关键动作的起止帧。在FG_NET人脸数据库上的实验验证了我们提出算法的有效性。所学测度可以清晰地刻画出人的老化趋势。即使通过简单的kNN回归,也可以得到与目前最好算法相比拟的年龄估计结果;所提出的基于协方差测度的模板匹配方法在TRECVID2008异常事件检测竞赛中得到应用,在检测“指”(pointing)这一动作的单项中,取得了最好的检测结果。
其他文献
从20世纪末开始,互联网信息技术突飞猛进的发展,标志着人类社会进入了网络时代。人类社会的日益网络化需要对其网络结构,各个网络之间的共性,自相似性的认识和处理他们的普适
容迟/容断网络(Delay/Disruption Tolerant Networking,DTN)作为一种端对端网络结构模型不仅可以实现异构网络的兼容性,还可保证极端通信环境中信息的可靠传输,所以被认为是
医学图像配准是对一幅医学图像寻求一种或一系列空间变换,使它与另一幅医学图像上的对应点达到空间一致,或最为相似。论文首先介绍了医学图像配准技术的发展和现状,分析了医
智能视频监控是计算机视觉领域的一个新兴的应用方向和备受关注的前沿课题,相对于传统的视频监控系统,智能视频监控系统具有监控能力强、安全隐患少,节省人力物力资源的优点
学位
无线传感器网络(Wireless Sensor Network, WSN)是计算机和通信领域发展的方向,也是当前研究的热点,在军事和国民生活领域都得到广泛应用。节点能量有限且不便进行能源补给是
传感器技术、微机电系统、现代网络和无线通信等技术的进步,推动了无线传感网络(Wireless Sensor Networks,WSN)的产生和发展。无线传感网络是集信息采集、信息传输、信息处理
Ad Hoc网络是由一组带有无线收发装置的移动终端组成的一个多跳的临时性自治系统。它具有无中心、自组织、拓扑结构动态变化和移动终端资源有限等特点。Ad Hoc网络的体系结构
近年来随着视频数据库的快速增长和视频监控系统的迅猛扩张,人工分析已经远远不能满足需要,因此急需能够对视频进行自动分析管理的技术。在视频分析技术中,对人体行为的识别