基于黎曼流形学习的视觉分类算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:lqh2012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的进步和科学技术的发展,在计算机视觉领域,我们采集到的图像数据相比于以前有两大明显特征:1.数据量变大;2.数据内蕴含的非线性信息变丰富。首先,数据量的变大使得基于图像集分类的方法成为可能。相比于传统的基于单张图片的分类方法,基于图像集的分类方法有更好的容错性,并且可以充分挖掘数据内部蕴含的相关信息。此外,由于传统的机器学习方法是基于欧氏空间理论的,因此难以有效挖掘数据中蕴含的非线性结构信息。但是,以微分几何、黎曼几何等理论为基础的流形学习方法可以有效的处理非线性数据,并且能充分挖掘数据的相关性信息,因此开始受到研究者越来越多的关注。因此,本文的研究重点主要在于黎曼流形学习及其在图像集分类中的应用。本文从黎曼流形学习的数学理论出发,回顾经典流形学习算法,提出改进算法。本文主要有以下贡献:1.从分析、代数、几何和优化等方面,系统介绍了与流形学习相关的最核心的数学理论。对于其中一些抽象的数学理论,也给出了一些直观的解释。此外,介绍了计算机视觉中常见的四种流形。同时,本文根据算法所涉及数学原理的深浅,从全新的角度对经典的流形学习算法进行了分类,并作了一定的讨论和对比。2.在浅层黎曼流形方法中,不同的黎曼流形蕴含着互补的统计信息。单流形建模难以充分利用这些互补信息,因而难以处理复杂情景下的分类任务。针对上述情况,多流形方法开始受到学者的关注。但是,多流形建模引入的计算负担又使得该方法的使用场景受限。因此,本文提出了多图嵌入的多流形度量学习算法。通过稀疏的图嵌入,使多流形的计算负担大大减少。该方法在多个数据集上取得了较好的实验结果。3.随着深度学习的成功,流形学习的研究中也开始出现深度黎曼网络。但是大多数现有的黎曼深度网络仅关注全局几何信息,无法有效的挖掘局部几何信息。针对这种情况,本文基于范畴论,将传统方法中的局部机制拓展到深度流形网络中,并在多个数据集上获得了较好的结果。4.在现有的深度黎曼网络中,对于流形降维层和欧式嵌入层的研究较少。但这种基础的研究却是十分重要的。本文基于黎曼几何理论,对矩阵对数进行了深入的分析,研究了矩阵对数诱导出的欧氏嵌入映射、Lie群同态和黎曼淹没(浸入),并将其应用于黎曼深度网络中。对于所提的两种自适应的欧氏嵌入层,本文在两个数据集上验证了其有效性。对于提出的Lie群同态和黎曼淹没(浸入)的理论框架,本文就如何应用于黎曼深度网络也做了一定的讨论。
其他文献
<正>变压器是电力系统中至关重要的设备之一,其运行的可靠性直接关系到电网连续可靠供电。差动保护是变电站主变保护的主保护之一,主要承担着保障变压器安全、可靠运行的责任。2011年6月28日,恒山变的2号主变空载合闸时,引起1号主变差动保护动作,造成恒山变10 kV母线短时失电。本文通过对恒山变1号、2号主变操作过程、保护动作情况、保护定值及故障录波信息进行综合分析,结合和应涌流的特点,指出和应涌流是
期刊
随着乡村振兴战略的实施,乡村建设日益受到重视,而传统村落则是形成年代较久远,拥有丰富的自然资源和深厚的文化遗产,值得重视和保护的村落。传统村落是乡村文脉的一个重要聚集地,具有地方特色、人文风情、乡土情怀,现有的景观空间环境充分反映了其独特的景观要素和具有地方特色的历史人文景观内涵。然而,传统村落的文化传承却没有得到足够的重视。本文以“文脉”为切入点,对邢台西部地区传统村落景观空间进行了研究。研究文
学位
随着铁路站点井喷式发展建设,铁路站前空间的景观品质关乎到旅客对于城市的第一印象;同时是当地政府部门响应国家政策,高度重视铁路事业的重要体现。站前空间一方面属于城市铁路枢纽的重要组成部分;另一方面它同时兼具重要的集散功能与景观效应,是展现城市形象与独特地域文化的“城市会客厅”。现阶段站前景观面临的问题:实践方面,在政策指引下广于建设,站前景观营建缺少地域特色和鲜明主题,导致设计趋同化的问题;站房周边
学位
药物-靶标相互作用是新药研发与药物重定位的基础。传统的实验技术因其高昂的时间和金钱成本,已经难以满足日益增长的药物研发需要。在信息时代,随着大数据与人工智能的发展,计算机辅助药物设计越来越受药物研发人员所关注,药物-靶标相互作用的预测与分析是计算机技术在药物设计中的重要应用,它涵盖了基因组学、高通量筛选、分子动力学模拟、复杂网络、矩阵分解、机器学习等多学科多领域的内容,大力推动着新药研发与药物重定
学位
随着智慧城市的建设和发展,监控摄像机被广泛安装和应用,由此产生的视频数据量呈现爆炸式的增长。如何高效地利用监控视频大数据是当前的研究热点,也是亟待解决的技术难点。因此,以简短表达监控视频为目的的视频浓缩技术得到了人们的广泛关注。视频浓缩技术是将原视频中的目标进行提取和分析,采用以空间换时间的方式,消除视频中的冗余信息,但现有的视频浓缩方法存在交互性保留不精准,复杂场景下视频浓缩性能不佳以及浓缩过程
学位
相比于传统的二维图像,光场图像(LFI)通过全光相机捕获每条入射光线的方向和位置,同时记录了场景的纹理内容和三维结构信息,在计算机视觉任务中拥有巨大优势。但是,在降雨天气采集的光场图像由于雨条纹和雨雾的遮挡,导致背景信息缺失。在低光照条件下采集的光场图像存在亮度低、噪声大等问题,导致图像质量降低。光场图像的修复与增强一直是计算机视觉领域的难点。因此,本文提出了一种光场图像去雨算法和一种低照度光场图
学位
纳税人口企业数量的不断增加给传统的办税大厅办税的税收方式带来了极大的挑战,这就要求税务机关推出网上办税渠道电子税务局系统。由于税务信息的保密性,并且电子税务局系统需要外网环境使用,因此需要使用一种安全性更高的加密算法,来保证系统的安全性。本文主要研究的是一种能够进行一次一密加密操作的改进AES+RSA混合加密算法,并使用该算法保证电子税务局客户端系统数据传输的安全性。本文的主要研究工作如下:(1)
学位
在当今数据大爆炸的时代,人工智能领域各种技术蓬勃发展,其中分类方法仍然是机器学习中重要的研究领域之一,机器学习中的分类方法研究在图像、语义识别等具体场景具有一定实用价值。随着移动互联网的高潮到来,数据量不断增大、数据类别不断丰富,不断提出新的应用场景需求,对传统的机器学习方法带来一定的挑战。面对多样性的数据经典分类方法无法处理好数据内在的关系,泛化性能表现不佳。因此,聚焦研究新数据应用场景下多视角
学位
医学图像分析是当前研究计算机视觉的关键领域之一,其中医学图像分割的作用是确定感兴趣对象的二维区域或内部体素的集合,感兴趣对象一般包括器官及其子部分,这是计算机辅助检测的第一步。本文针对医学图像分割任务,基于深度学习的算法展开研究,在细胞核、肝脏和肺部图像分割数据集上进行实验,以提高医学图像分割的精度。主要研究内容包括:首先,改进一种基于卷积神经网络和编解码结构的细胞核图像分割算法(Att Inc
学位
文本简化的目的是为了在保持文本语义不变的情况下,降低语句的复杂度,将复杂的文本转换成更易于理解的文本。文本简化主要分为词汇简化和句子级别的文本简化两个方面。传统的词汇简化算法依赖于人工标记的数据集或者只关注复杂词本身而未能有效的关注复杂词的上下文,导致生成的候选词不符合上下文语境。同时,主流的文本简化模型的性能也依赖于高质量的数据集,但是文本简化数据集较少并且数据集中的信息并不完全准确。为了解决以
学位