视觉特征分析的概率图模型方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sjappleshujin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用局部视觉特征来解决计算机视觉中的物体识别问题是当今研究的一个趋势。其中关键问题是如何利用好局部视觉特征,使其能够如实地反映图像语意。另一方面,机器学习领域中概率图模型由于其灵活的建模方式和成熟的算法在很多领域取得不少成功。本文主要阐述概率图模型的理论算法和在视觉特征分析中的应用,并且对一个从文本挖掘领域借鉴来的LDA模型进行扩展,使其能够更加适合视觉问题。从内容上本文对计算机视觉中的建模做了一个简要的综述,侧重于介绍使用概率图模型框架解决视觉问题的模型。本文还回顾了概率图模型的理论和算法,侧重于贝叶斯网络,EM算法,variational推断和Gibbs采样;而后详细解析了LDA模型的建模方式、推断和学习算法。接着本文提出了LDA一种的扩展模型――仿射不变的主题模型(AITM),并且应用到物体识别问题。经过在数据集上的仿真实验验证了AITM的有效性。本文最大的贡献是提出了AITM。作为对LDA的扩展,AITM放弃了LDA中“bag of words”的假设,加入了视觉特征的空间结构信息。AITM不直接对局部特征位置进行建模,而是假设在某个给定的隐主题下局部特征的位置是由先验位置在某个仿射变换后得到的,并且把先验位置和仿射变换建模成隐变量。AITM的优势在于能够用较少的参数来刻画视觉特征空间结构,不易导致特征组合爆炸的问题。
其他文献
在医学可视化领域中,如何进行有效的中心线提取一直是研究人员不断进行研究与探索的方向。较好的提取出图像中管状结构的中心线不但可以使医学应用中基于虚拟路径导航诊断方
本文在综述隐通道分析方法和研究现状的基础上,解决了自动化分析系统源代码中信息流的问题,并将信息流组织成信息流图,设计并实现了一个基于静态分析的隐通道检测框架。本文
在计算机技术迅速发展的今天,人脸识别作为一种直接和友好的模式识别技术,受到越来越广泛的关注。本文主要对基于空间变换的流形学习方法Isomap算法和LPP算法、稀疏描述方法
主动存储将用户数据的应用处理下放到存储设备一级,为信息安全、多媒体信息处理以及数据挖掘等数据密集型应用提供了一种有效的解决途径。目前关于主动存储系统的研究工作都是
RFID是非接触式地自动识别技术,它利用无线射频方式在读写器和射频卡之间进行非接触式地双向数据传输,具有无源、免接触操作、不易受环境影响、高安全性等优点,广泛应用于公交系
本文回顾了三维机织复合材料理论研究的发展,指出了存在的问题。引用经纱脉络描述法解决了任意三维机织复合材料的拓扑结构表征问题,参考了单胞分解法及亚胞向量的概念,实现了三
无线自组网是一种由多个无线节点组成的不需要固定设备支持的自治网络。网络中节点之间关系对等,并且由于其配置部署简易,使得无线自组网越来越被广泛地应用于各种军事和民用
近年来半监督学习成为了机器学习领域的研究热点之一,作为半监督学习分支之一的半监督聚类也引起了越来越多的关注。与传统聚类算法相比,半监督聚类能利用少量的监督信息引导
随着彩色信息在相关领域得到越来越广泛的应用,人们对色彩再现质量也提出了更高的要求。由于传统四色印刷不能很好再现某些特定图像,专色印刷应运而生,但仍需借助ICC Profile
在工业现场领域,已经投入使用的嵌入式设备的软件需要经常更新,这些嵌入式设备不便拆卸和不作为单独个体接入互联网的特点,使现有的JTAG接口升级方法和互联网远程升级方法都