多标记特征选择及其类属属性获取算法

来源 :安庆师范大学 | 被引量 : 0次 | 上传用户:w354026268
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大数据技术以及人工智能技术得到了高速的发展,同时也推动了多标记学习的发展,多标记学习逐渐被诸多学者和专家列入重点的研究课题并在这方面取得了非常不错的成绩。其中,多标记特征选择也在数据挖掘和机器学习中得到了越来越多的关注,而且已经提出了大量的算法来实现特征空间的降维,并成功地应用于多种领域。多标记特征选择的目的就是实现特征降维,选择具有高度鉴别能力的特征,来实现相关性最大化与冗余性最小化。与多标记特征提取不同,特征选择是从原始特征空间中选择特征,不进行任何变换,很好地保留了原始特征的物理意义,在可读性和可解释性方面,多标记特征选择算法已成为许多研究者关注的焦点。在多数特征选择算法中主要利用信息熵等方法判断相关性,利用条件概率判断冗余性,这些方法不仅需要先验知识,而且计算较为复杂。并且进行多标记特征选择时,标记具有其本身所独有的属性,这些独有的属性对于标记具有很强的判别能力,因此,加强对类属属性的研究,可以更加高效地开展多标记学习,基于上述问题,本文提出了两种特征选择算法,主要内容如下:(1)本文利用粗糙集隶属度与肯德尔相关系数进行特征选择。粗糙集计算的特点就是不需要先验知识,对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。本文首先利用粗糙集中的隶属度计算特征与标记空间的相关性,将相关性最高的特征存入已选特征子集中。然后利用肯德尔相关系数计算已选特征与未选特征之间的冗余性,将相关性与冗余性差值最大的特征存入已选特征中,每当存入一个特征后,重新计算冗余性,直到所有特征都存入已选特征。最后在已选特征子集中,取前k个特征作为最后约简的特征子集进行训练和分类测试。在多个数据集的实验结果中说明了算法的有效性。(2)本文首先稀疏表示特征,然后对稀疏之后的特征进行互信息大小计算。标记都具有其本身所独有的属性,即类属属性,在进行特征选择时,可以对类属属性进行稀疏表示,但是对于通过类属属性处理后的特征而言,可能还存在一定的冗余。本文结合信息熵对新的特征空间中所有特征,分别计算其与标记空间的互信息,根据互信息的大小,对特征依次进行排序,并取前90%作为最终的特征子集。在研究中测试了多标记数据集,最终的测试结果显示,该算法体现了较强的可行性。
其他文献
膨胀土在我国范围内分布广泛,由于其吸水膨胀失水收缩的特性在实际工程中造成巨大经济损失,故需针对膨胀土胀缩性进行改良,由于自然界膨胀土一般均为非饱和状态存在,经典土力学强度理论已经无法解释在干湿循环下膨胀土其强度及变形特性。将风化砂与膨胀土按一定比例混合制样并在不同初始干密度、基质吸力条件下的进行固结排水非饱和土三轴试验,研究一定掺砂率下非饱和膨胀土强度特性试验结果表明:(1)风化砂对膨胀土的胀缩性
介质阻挡放电(Dielectric Barrier Discharge,DBD)可以很容易地在大气压下产生低温等离子体,获得自由基、气体原子、激发态原子、离子等强化学活性粒子,并实现通常情况下难以进行的化学反应。主要大气污染物之一一氧化氮(NO)化学性质不活泼,难以通过常规化学手段去除。可以先通过DBD氧化法转化为化学性质活泼的NO_2,其去除便变得容易得多。DBD技术因能获得很高的NO转化率,且
Buck变换器因其高效性与输出电压的灵活性被广泛应用。随着移动便携式设备应用处理器性能的逐渐增强,对Buck变换器也提出了越来越高的要求。快速负载响应与高集成度逐渐成为
随着电网发展及灾害性气象条件的出现,输电线路舞动造成的跳闸、断线、倒塔等事故频有发生,严重影响线路安全。故开展线路舞动研究,系统地分析线路参数及环境因素对导线舞动
自上世纪90年代我国开始建设期货市场以来,先后经历了初始探索期、清理整顿期以及快速发展期。随着我国建设期货市场的经验不断丰富、相关制度逐渐完善,国内期货市场尤其是农产品期货市场发展迅猛。在农产品期货市场的众多品种中,饲料类期货始终占据着不可替代的地位。饲料类期货与我国畜牧产业紧密相关,豆粕、玉米等品种都是畜牧业重要的原材料。畜牧产业作为我国农业结构中的重要组成部分,其产出水平约占国内农业总产值的4
建立统一的市场经济体系同时实现绿色的经济增长是我国未来经济发展的重要目标。为此,我国先后对珠三角、长三角、京津冀、环渤海、粤港澳大湾区等不同范围的区域进行了战略部署,促进其协同发展。其中,党的十四大正式提出环渤海经济圈的概念,这标志着这一区域的协同发展正式上升为国家战略。环渤海经济圈依托其丰富的自然资源和优越的地理位置,成为我国北方的经济龙头。改革开放以来,这一区域的市场一体化和金融集聚不断加深,
多次重大地震灾害的结果表明,建筑物的倒塌是造成人员伤亡以及财产损失的最主要原因,在多层钢筋混凝土框架结构中,墙的破坏可能会引起更大的人员伤亡和财产损失。若采用配有
本试验旨在研究氨基乙酰丙酸(ALA)对母猪和仔猪的生产性能、血清生化和抗氧化指标、器官铁含量和铁代谢相关因子表达量的影响,揭示氨基乙酰丙酸的作用机理并为其在动物生产中应用提供理论依据。试验选取3-4胎次、妊娠期第85d“长白×大白”二元杂交母猪32头,随机分为4个处理组,每个处理8个重复。整个试验分为妊娠期和仔猪哺乳期两个阶段。在妊娠期阶段,对照组饲喂基础饲粮,试验组在基础饲粮中分别添加25 mg
目的本文将探讨内皮细胞特异性分子-1(endocan)、血清淀粉样蛋白A(Serum Amyloid A,SAA)、中性粒细胞与淋巴细胞比率(neutrophil-to-lymphocyte ratio,NLR)这三种炎症标志物
目前,自动驾驶已经成为车辆工程领域的研究热点并引领着未来的产业化方向,其中高可靠性的智能化决策控制是相关技术领域的关键所在。从车辆自动化控制技术的发展现状来看,各