【摘 要】
:
信息传播技术的发展,使得图片、文本和视频数据等高维数字信息在网络中呈现指数式增长,让数据分析及预测的发展受到了极大地限制。如何有效地解决高维海量数据带来的种种问题,成为数据挖掘和机器视觉领域的研究热点之一。另外,多样化数据的快速增长让数据标签的获取成本愈加不受控制。因此,基于半监督数据的特征选择方法成为数据降维领域的重要研究内容。特别地,基于最小二乘回归的稀疏特征选择方法通过设计高效的模型,学习并
【基金项目】
:
国家自然科学基金(Nos.61976182);
论文部分内容阅读
信息传播技术的发展,使得图片、文本和视频数据等高维数字信息在网络中呈现指数式增长,让数据分析及预测的发展受到了极大地限制。如何有效地解决高维海量数据带来的种种问题,成为数据挖掘和机器视觉领域的研究热点之一。另外,多样化数据的快速增长让数据标签的获取成本愈加不受控制。因此,基于半监督数据的特征选择方法成为数据降维领域的重要研究内容。特别地,基于最小二乘回归的稀疏特征选择方法通过设计高效的模型,学习并选择最具鉴别性的特征子集。但现有的基于最小二乘回归的稀疏特征选择方法未能很好地利用半监督数据的信息,也常常不能全方位考量特征与特征、特征与标签、标签与标签之间的关系,甚至大多数方法未曾考虑到特征的冗余性。针对以上问题,本文设计了三个算法,从不同角度改进了基于最小二乘回归的稀疏特征选择模型,并获得了较好的效果。本文的主要工作如下:1.提出了一种新的基于局部自适应和冗余最小化的半监督特征选择(SFS-LARLRM)算法。该算法为减少离群点和噪声的影响,在半监督稀疏特征选择框架中引入局部回归学习和自适应学习。为去除冗余特征,采用惩罚高相关性特征的冗余正则化方法。另外,使用互信息和Pearson相关系数来计算特征相似度映射矩阵。设计了一种迭代方法求解目标函数,然后从理论分析和实验验证两方面证明了SFS-LARLRM算法的收敛性。2.提出了一种考虑特征流形的低维空间Hessian半监督稀疏特征选择(HSLF)算法。该方法将低维Hessian正则化引入到半监督稀疏特征特征选择框架中,更好地保留了低维空间局部流形结构;从特征角度构建相似图,采用特征流形正则化方法使得特征选择矩阵平滑于特征流形结构;将L2,1/2-norm稀疏模型引入特征选择矩阵以使其更加稀疏。给出了迭代方法求解所提出目标函数的方法。3.提出了一种新的基于最大相关最小冗余的半监督Hessian多标签特征选择(S2MFSHMRMR)方法。在该方法中,Hessian正则化和HSIC(Hilbert-Schmidt independence criterion,希尔伯特-施密特独立性准则)分别用于反映数据固有局部几何特性及解决特征与多个标签的相关性问题;提出了自定义冗余正则化方法,使用基于GMM的巴氏距离度量特征间冗余性;巴氏距离采用的软标签则运用多标签传播方法获得;提出了一个基于矩阵拉格朗日乘子法的封闭式方法以解决最小化目标函数。以上算法均采用公用数据集评测其性能,并分析参数敏感性,收敛性等。实验结果表明本文提出的算法在有限的标签的情况下,能够获取有效的特征子集以提高分类算法的性能。
其他文献
城市轨道交通作为一种重要的交通运输工具,随着城市的大力发展、市民日常生活的需求增加,则要求列车运行的速度需要提高,促使为列车提供动力的牵引供电系统的结构越来越复杂。因此,面对越来越复杂的牵引供电系统,能否正常安全的运行显得愈加重要。从可靠性角度对牵引供电系统进行评估,可以对不同结构的牵引供电系统进行对比评价,也可以对系统中各个部位的可靠性进行计算,分析系统的薄弱环节,对实际工程提供参考数据。本文介
苯丙烷代谢途径是植物次生代谢的重要途径,其产物包括木质素,类黄酮和其他次生代谢产物。木质素和类黄酮等化合物作为植物细胞壁的重要组成成分,广泛参与植物耐受胁迫的生理过程。因此开展苯丙烷代谢途径中相关酶及其编码基因的功能与应用研究,不仅能够更清晰地认识到相关产物的合成路线,还能够为酶的合理改造、基因表达调控与转基因植物的培育奠定理论基础。川芎(Ligusticum chuanxiong Hort)作为
自改革开放以来,中国的社会经济蓬勃发展,企业间的竞争愈发激烈,企业竞争追本溯源是人才的竞争。因此,对于企业而言,如何引进人才、留住人才逐渐演变为企业发展的关键环节。我国企业应从薪酬管理入手,通过调整、完善、改革旧的薪酬管理方案,结合员工需求,形成企业实际情况相适应的薪酬结构,从而保证员工获得公正合理的劳动报酬,满足经济和心理的双重需求,提高员工工作热情,使企业薪酬管理更加有效。本文在薪酬基本理论的
直流级联系统作为直流分布式电源系统最基本的结构,具有易于模块化设计、热设计难度低、便于维护等优点,已在数据处理中心、多电飞机、电动汽车等领域中取得了广泛应用。级联前每个变换器是单独设计的,级联后变换器之间相互作用,可能会使得直流级联系统动态性能下降甚至无法稳定运行。因此,分析和改善直流级联系统的稳定性具有重要意义。本文以电压型控制级联Buck-Buck变换器为例,从阻抗的角度分析了直流级联系统的稳
地铁站间距离较短,使得地铁车辆在运行过程中频繁起动和停止,进而产生大量的再生制动能量。目前地铁牵引供电系统普遍采用12(24)脉波整流机组,其能量只能单向流动,无法吸收这部分再生制动能量。双向变流器可以将交流电转换为直流电供列车牵引使用,也可以使列车再生制动能量逆变回馈给交流电网,是再生制动能量利用的研究方向之一。本文依托科研项目“地铁牵引供电双向变流器”,开展大功率双向变流器的研制工作。首先分析
在我国现今铁路发展中,工频单相交流供电制式一般使用在干线铁路中,而城市轨道交通使用的供电制式为直流供电,电压等级较低,但在直流供电系统中会产生较严重的杂散电流,此外,现有干线铁路及城市轨道大多采用架空接触网进行供电,这种形式的牵引网会占有较大的空间,需要大的隧道断面,从而增加施工难度和成本。本文中描述的三相交流牵引供电系统采用供电轨供电,这种设置在列车底部的供电轨降低了接触结构复杂性,充分发挥了三
针对某有轨电车变电站与有轨电车车辆存在的供电模块短路烧损、变电所跳闸、车辆跳高断(高速断路器)等问题,本文提出对有轨电车变电站以及电车内部工作状态进行监测,为解决该线路的供电系统问题提供数据基础。本论文设计了一套城轨车辆及变电站的远程监测系统,系统能够获取城轨车辆及变电站的运行数据信息,并通过无线通信技术经由云服务器发送到远程监测平台,实时监测城轨车辆的运行参数,及时掌握变电站的设备运行状态,不受
如今,电力电子技术早已时过境迁,我们对电磁干扰并不陌生,电磁兼容性问题也早已不再局限于军事,而是广泛应用于通信、电气设备、医疗器械等领域,并且人们也越来越重视电磁兼容问题。电磁干扰往往会导致电力电子设备或系统出现故障,严重时可能会损坏设备甚至危及我们的身体健康。针对电磁兼容性问题,国内外诸多组织机构根据不同设备、不同场景制定了各类电磁兼容标准。如IEC制定的IEC 61000系列电磁兼容标准,我国
列车控制系统的响应延迟会导致列车运行过程中的速度跟踪性能差、不安全运行和能源浪费。而随着高速铁路的快速发展,更高的性能指标,如更快的运行速度、更大的发车密度等,对多列车的高追踪性能和高安全性等性能提出了更高的要求。本文主要分析了单列车在节能优化、跟踪控制以及时滞方面的国内外研究现状,以运行过程中的高速列车为研究对象,考虑运行中的高速列车含有状态时滞以及参数不确定性,提出三个控制指标,以控制指标为衡
绝缘栅双极型晶体管(insulated gate bipolar transistor,IGBT)在电力电子系统中应用广泛,其因老化而产生的失效若不能提前被发现,可能会造成系统性的损坏,甚至造成重大灾难。本文主要研究基于特征参数的IGBT老化状态监测方法和寿命预测方法,以实现IGBT老化状态的实时评估,在老化失效前发出预警,以提高电力电子系统运行的可靠性和运维的经济性。在详细分析IGBT老化失效机