基于空间核学习的图像分类研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:linux_secway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是当前计算机视觉研究的热点。该问题涉及两个重要的因素:一是图像的表示;二是分类算法的设计。在图像的表示上,词袋模型在信息检索领域的成功应用启发计算机视觉研究者利用局部特征形成词袋模型,为多类图像、目标提供一种统一的表示框架。研究证明词袋模型是一种有效的模式表示方法。然而,词袋模型假设视觉词之间是独立的,忽视了视觉词之间的关联性,从而,词袋模型在表示一些复杂图像时,其判别性不强,造成在多类图像分类时,分类性能不高。在图像分类中,支持向量机是一种流行的分类工具,然而,其核函数的选择极大的影响分类的性能。常用的核函数选择是基于大量的交叉验证,该方法费时耗力。本文针对词袋模型和支持向量机核函数的设计、选择方面的局限性,开展以下三方面的研究:1)基于空间几何关系的词袋模型设计;2)空间核函数的设计;3)基于多核选择的图像分类。  本文的主要创新和贡献为:  (1)提出一种结合局部特征空间关系的EMD空间核。EMD空间核是一种组合核,由EMD核和空间核构成,其中空间核利用MSER特征区域和Hessian-laplacian特征的空间互补性质,进行两两图像之间特征的全局匹配,得到图像间的相似度。  (2)提出一种局部空间金字塔表示的图像特征表示方法。该方法利用了MSER特征区域和Hessian-laplacian特征的空间互补性质,首先在MSER区域进行四划分,第一层利用MSER视觉词对图像进行词袋表示,第二层,在MSER区域中对Hessian-laplacian特征的分布进行词袋直方图表示。实验表明在视觉目标分类问题上,本文提出局部空间金字塔表示比传统空间金字塔有更好性能。  (3)利用EMD核、局部空间金字塔匹配核等多种核函数进行多核学习,自动选择多核函数的组合系数,得到多核分类模型。实验表明根据不同情况自动分配核权重并选择是否加入空间信息辅助分类可以有效提升图像分类的准确度。
其他文献
关键词抽取是自然语言处理中的基础与核心技术。通常对非结构化文本的自动处理,如自动文摘、文本聚类、自动问答等,均需要先进行关键词抽取。关键词是表达文档主题意义的最小单
贝叶斯网络是一种概率图模型,能够高效表示随机变量之间复杂的独立依赖关系;即使在数据不完整的情况下,仍然具备高效的推理能力,因此越来越广泛的用于决策、诊断和复杂系统的控制
Web2.0时代的来临,向人们呈现了一个丰富多彩的英特网,同时也掀开了信息爆炸时代的序幕。海量数据的涌现不仅为英特网带来了无限可能,更对传统数据索引结构乃至整个计算机产业带
随着计算机和网络技术的飞速发展,计算机在企事业管理中应用的普及,利用计算机实现电子文档的管理势在必行,办公自动化是企事业单位在信息化建设基本阶段的典型需求,目的是为了规
现代信息技术的发展以及各种图像处理软件的出现,使得伪造图像和篡改图像变得越来越容易,如何鉴别收到的图像是否是原始图像,是否经过篡改,是否是人为伪造,通过各种图像采集
李群机器学习既继承了流形学习的优点,又充分利用了李群的代数结构和几何结构的数学本质,自提出以来就引起了许多研究者的关注。本文是在李群机器学习的理论框架上,以李群机器学
嵌入式远程监控系统是一种以嵌入式技术、视频编码技术及网络传输技术为核心的新型视频监控系统,它在监控系统的实时性、网络化、小型化等方面比传统远程监控系统有着突出的
随着网络应用的迅速扩张,IPv4地址资源枯竭的问题已无法回避亦不可调和,发展下一代网络IPv6已成为必然而紧要的工作。可以预见,在未来几年里,全世界将迎来IPv6网络规模化部署
信息技术的迅猛发展和广泛应用,为现代社会的生产和生活提供了巨大的便利,信息安全和隐私保护的问题也变得越来越突出。访问控制是实现信息安全的重要技术之一,它主要通过限制合