【摘 要】
:
过高的特征维度导致了机器学习训练过程中存储开销大,运算量大,时间成本高。并且,这种现象随着环境空间维度的成倍增加,而训练数据在整个数据空间中的比例急剧下降,导致训练模型泛化较差。解决这些问题的一个重要方法是降维,即通过一些有效的手段将原始的高维空间数据转换到低维子空间。流形学习假设高维环境空间中的数据分布于低维嵌入的某个流形上或附近,因而降维问题可以理解为低维流形恢复问题。鉴于非线性流形学习算法在
论文部分内容阅读
过高的特征维度导致了机器学习训练过程中存储开销大,运算量大,时间成本高。并且,这种现象随着环境空间维度的成倍增加,而训练数据在整个数据空间中的比例急剧下降,导致训练模型泛化较差。解决这些问题的一个重要方法是降维,即通过一些有效的手段将原始的高维空间数据转换到低维子空间。流形学习假设高维环境空间中的数据分布于低维嵌入的某个流形上或附近,因而降维问题可以理解为低维流形恢复问题。鉴于非线性流形学习算法在时间开销以及样本外扩展上具有很大的局限性,从而推动了图框架下的流形鉴别分析的发展。本文针对流形鉴别分析中广泛存在的问题进行了一系列的尝试和探讨,具体贡献归纳如下:·提出了一种多流形正交保邻域鉴别分析算法,从邻域块对齐的角度,同时考虑样本间的类内紧凑性、类内重构关系与类间可分离性。此外,将类内结构信息融入到类内紧凑损失中,考虑两个重构组的紧凑性而非单一的样本对。然后,通过分析投影方向与最大类间间隔的关系,选择适合于迫使类间可分性的样本。最终,采用一种快速的正交化方法得到带有正交属性的子空间。而且,在再生核希尔伯特空间中诱导非线性特征提取,可应对分布于非线性流形上的数据。在一个玩具数据集和几个人脸图像基准数据集上的实验结果表明了所提算法的有效性。·提出了一种新的线性鉴别分析表达,该表达将最大间隔准则与L1,2范数诱导的加权策略相结合,既避免遭遇小样本问题又可以有效缓解离群值带来的影响。所提模型实现了加权类内中心和全局中心的自适应计算,进一步减小异常值的影响。采用L2,1范数迫使投影矩阵产生行稀疏性,使得子空间学习和特征选择能够协同进行。此外,还推导了一种有效的交替迭代算法,并在理论上证明了其收敛性。从计算复杂度分析来看,所提算法能够处理大规模的数据。在多个场景下的基准数据集上进行的实验表明,该算法比现有的方法更有效,且具有更好的泛化性能。·提出了一种鉴别性更强的特征提取框架。在所提模型中,融入了一种利用非平方L2范数来增强数据流形的局部类内紧凑性的新策略,可以实现局部感知图结构和理想投影矩阵的联合学习。此外,不再采用一般的平均间隔或者加权平均间隔最大化策略,而是建立了一种加权灵活目标学习的回归模型来进行间隔表示的自适应学习。通过使用联合的L2,1范数度量回归间隔表示项、局部自适应感知项以及投影矩阵正则化项,达到了缓解异常值干扰和防止过拟合的目的。然后,给出了求解该模型的有效迭代算法,并给出了收敛性的理论证明。在一系列基准数据库上的实验结果表明,所提算法优于一些最先进的方法。·提出了一种分类导向的自学习图嵌入鉴别特征学习框架,可以灵活地学习到低维的数据紧凑表示。以相对熵正则化样本间的亲和关系,诱导同时兼顾高维观察空间与低维嵌入空间的结构化图学习。在全局的结构化图学习过程中,配备联合的线性分类器学习,用以检验低维嵌入样本的类间分离性,同时将检验结果反馈给图学习。此外,所提框架可以很容易地扩展到半监督的情况。在几个广泛使用的基准数据库上进行了大量的实验,并与一些最先进的方法进行了比较,证明了该方法的有效性。
其他文献
近年来,微型涡喷发动机被广泛应用于各种小型作战武器以及无人机上,微型涡喷发动机具有体积小、重量轻、可靠性高等优点。作为精确打击小型作战武器的动力供应系统具有很重要的研究价值。因此本文针对某型微型涡喷发动机的工作特点,对其控制需求进行分析,并根据控制器的控制需求设计该控制器的整体方案,对控制系统的硬件以及软件部分进行设计并完成PCB布板和实验。为提高微型涡喷发动机的转速控制系统的鲁棒性和响应速度,采
超空泡减阻技术在水下高速航行体的研究中应用广泛,对该技术的研究主要包括数值仿真和实验研究两方面,其中,由于超空泡本身复杂的流场特性,实验研究是评估航行体水下运动性能的重要手段。超空泡射弹水槽实验研究相较仿真研究,其空化现象与实际应用更为相近,但由于其发射状态不易控制、试验条件受限及分析方法缺乏等,取得的成果有限。本文针对目前对水中高速射弹空泡形态及弹道参数精确测试能力的不足,搭建了一套能够对超空泡
逆变器是一种将直流电转换为交流电的电能变换装置。多电平逆变器具有开关管电压应力低、输出电压质量高以及电磁干扰小等诸多优势受到广泛研究。相对于传统多电平逆变器而言,双向高频隔离多电平逆变器结合了高频链技术和多电平逆变技术,不仅具有多电平技术的诸多优势,还兼具有高频电气隔离、双向功率流等优点。目前,双向高频隔离多电平逆变器主要采用基于双有源桥的两级式架构。两级式架构由高频隔离DC-DC和全桥DC-AC
随着图像数据的日益增长,图像近似搜索(又称图像检索)扮演着越来越重要的作用。在过去的几年里,监督的图像检索可以获得令人满意的效果,然而由于带标签数据集的稀少以及人工标注的成本太高,无监督的图像检索成为主要关注点。为了节省存储空间,本文研究稀疏图在无监督图像检索中的应用,致力于在节省空间的同时提高图像近似搜索的精确度。该技术目前有以下三个主要问题需要解决:(1)标签信息缺失情况下的近邻信息挖掘问题。
目前,黑磷作为一种新型的二维层状半导体材料,具有石墨烯等其他二维材料不具备的优异性能,如高电子迁移率和开关比、具有直接带隙,良好的生物安全性等等,这使其在生物、医疗、光催化等领域有着广泛的应用潜力。本文基于上述优点对黑磷在光动力学治疗领域的应用进行了研究,首先对制备黑磷量子点的工艺进行了探索,采用液相剥离的手段获得黑磷量子点(BPQDS),并通过高分辨透射电子显微镜(TEM)、拉曼光谱仪(Rama
随着遥感对地观测技术的发展,单一类型的遥感图像已经无法满足逐渐增长的应用需求,而不同类型的遥感数据的之间会存在一定的差异性和互补性,因此越来越多的学者将目光转向了多源遥感数据的协同分类。在众多类型的遥感图像中,高光谱图像以其精细的光谱分辨率在地物分类中占据重要的地位,但高光谱图像普遍存在空间分辨率低的问题,空间分辨率的不足导致图像中会存在较多的混合像元,这给地物的精细分类带来了极大的干扰。因此,本
冲压加速器是一种利用混合气体推进剂的化学能,将弹丸加速到高超声速的新概念推进装置。推进剂的反应速率和放热量较高时,火焰阵面会向弹丸前体移动,并越过弹丸肩部,对弹丸产生阻力,产生不启动现象。当弹丸肩部表面存在激波反射点时,激波后方的高压区对火焰的传播有一定的阻塞作用,能够扩大推进剂的反应速率范围。根据这一思想,本文基于粘性理想气体假设,采用SST k-ω湍流模型、有限速率/涡耗散模型和甲烷-氧气单步
运动想象脑电信号是由大脑进行想象运动时激发的信号。基于运动想象脑电信号控制的脑机接口(Brain Computer Interface,BCI)系统可以直接将大脑想象的运动意图解码为控制指令,完成对外部设备的控制。作为一种新型人机交互技术,BCI系统可以应用于多种场景,但是实际应用中基于运动想象脑电信号的BCI系统存在着:运动想象脑电信号种类少、多分类任务的识别准确率低和实时传输速率慢等问题。为实
由于通讯网络连结了网络空间及实体空间,因此网络化控制系统可以在长距离下执行许多任务。而且,网络化控制系统的信息都透过共享的网络传输,省去了不必要的配线,减少系统复杂度,也降低了设计及架设系统需要的成本。若要增加传感器、控制器或是执行器来调整或是更新系统,也可以用较低的成本达到,而且不会变动系统的主架构。因此,与传统的控制系统相比,网络化控制系统有无与伦比的优势。在此基础上,本文研究了基于采样数据的
专利是重要的知识财富,通过研究专利可以找到重要的技术细节和关系,这些信息和关系为制定研发策略提供有价值的信息。因此有必要进行专利检索和核心专利识别方法的研究。但随着专利数量增加,专利检索成本以及核心专利识别难度也日益增加,主要原因在于专利描述文本自身的特点,如专利文本冗长,专利描述中充斥着各种技术和法律术语等。为了提高检索质量以及准确度,通过核心专利推演关键领域未来的发展趋势,论文以专利文本作为研