基于标记分布和代价敏感的多标记特征选择算法研究

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:linjavac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各应用领域中数据量的快速增长,特征维度越来越高,语义日益丰富,数据通常呈现高维性和多标记性。多标记特征选择作为机器学习中一种重要的预处理步骤,它能够删除不相关和冗余的特征,同时选出提升多标记分类性能的特征子集。然而,传统的多标记学习也存在着其不能够解释的问题,即:“在该实例中,各个标记对其的描述程度分别是多少?”。标记分布学习作为一个广义的多标记学习范式,在此范式中,实例按相关标记所占的分布比例进行描述,能够很好地回答上述问题,从而解决此类新的语义问题。同时,代价敏感学习作为数据挖掘任务中的十大热点问题之一吸引了众多学者关注,因为在现实生活中,获取数据通常需要付出相应的代价成本去获取实例下的特征值。因此,本文围绕标记分布学习和代价敏感学习两方面开展多标记特征选择算法方面的研究,本文的主要研究工作如下所示:首先,从粒计算和标记分布的角度,提出了一种基于标记分布和特征互补性的多标记特征选择方法。算法首先基于邻域模型的粒计算方法,获取了多标记数据集中每个实例下的所有相关标记的不同重要度,从而对传统逻辑标记进行标记增强,以获取潜藏在传统多标记学习下的标记分布信息;然后,在考虑两种特征相关性的同时,进一步通过邻域互信息估计特征之间的互补性对特征进行评价,以选择出满足条件的候选特征。最后,通过在十个公开数据集和六个指标上与四个主流方法进行对比,实验结果验证了所提出的方法的有效性和优越性。其次,本文从代价敏感的角度设计了一种基于邻域粒度和标记增强的代价敏感多标记特征选择算法。该算法利用邻域粒度对传统的逻辑标记进行标记增强,从而挖掘出更多的监督信息,并利用代价敏感中的三种分布形式拟合现实世界中的代价分布情况,再将其的影响考虑到多标记特征选择算法当中,设计了一种可以选择与标记集合高度相关并且代价相对较低的特征子集的方法。最后,通过在十个公开数据集和代价约简率及其他五个常用指标上与四种主流方法进行对比,实验结果论证了所提出的方法的有效性及可行性。
其他文献
罗甸县是国家级贫困县,推进现代信息技术与农业产业的融合,对农业转型升级、农村经济发展和农民脱贫致富至关重要。目前国内对县级农业信息化的研究较少,尤其是对山地喀斯特地貌区域的县域农业信息化研究几乎未见报道。本研究通过大量阅读文献结合实地走访调研、发放300份问卷进行调查等方式对罗甸县农业信息化的当前发展的现状进行分析,以期找出罗甸县农业信息化发展方面存在的问题,并结合调查数据和文献资料分析提出罗甸县
长鳍金枪鱼(Thunnus alalunga)是大洋性中上层鱼类,广泛分布在热带及温带海域。南太平洋拥有丰富的金枪鱼资源,中国于2008年后成为南太平洋长鳍金枪鱼最重要的捕捞国。长鳍金枪鱼是一种高度洄游鱼类,其渔场位置与洄游路径密切相关,同时渔场的形成也受环境条件变化的影响,呈现出年际以及月际间的变化。准确地进行中心渔场预报,可以指导远洋渔业相关企业合理地安排作业区域,有效地提高生产能力,这对我国
1,2,3-三氮唑是许多药物分子、功能分子、金属配体的关键结构单元,在医疗卫生、材料及生命科学等领域有广泛的应用。连续三个氮原子处于同环使得该类化合物呈现出独特的物理或者化学性质,而且在药物化学及合成化学中常被用作氮杂合成子。本文以特定条件下1,2,3-三氮唑的开环和不开环性质展开论述。基于1,2,3-三氮唑的烷基化反应,设计并完成1,2,3-三氮唑的选择性杂环烷基化反应。本论文分为两章:第一章主
随着改革开放的进程不断加快以来,我国的经济逐渐成长为当今世界第二的经济体,取得的成果让世人惊叹。而我国城市化进程不断加速,现有的基础设施已经远远不能满足城市居民的需求,而随着需求的不断增加,从前由政府主导的建设模式已经跟不上时代的发展,大量的城市建设导致政府的资金严重吃紧,因此基于政府和社会资本共同合作的投资模式——PPP模式进入了我们的视线之内。PPP模式是一种基于公私合作的新型项目融资模式,这
随着经济的快速发展,科学技术不断进步,无人机倾斜摄影技术在大范围地形数据采集过程中发挥了重要作用,对三维测绘相关研究得到极大的促进。为实现地理信息技术的应用与推广打下了坚实的基础。但无论是倾斜摄影、激光扫描技术、测深仪技术等各种测绘手段,各有自身的缺陷不能克服。因此,开展多种测绘手段结合的研究,发挥自身技术的优势,相互补充不足,对三维实景模型进行各个方位全面的构建,然后进行三维实景模型可视化和应用
白光LED因其发光亮度高、寿命长、应用范围广、节能环保等优点成为当今发光材料研究的热点。在众多半导体材料中,宽带隙半导体氧化锌(ZnO)材料表现出优异的光致发光(PL)特性,包括近带边紫外发光和深能级可见光发射。然而,ZnO的可见光发射带中仅有蓝光、黄光和绿光发射,缺少红光发射,制约了高品质白光发射ZnO基发光器件的开发。因此寻找简单,高效,环保的方法制备出高品质白光发射的ZnO得到了广泛的关注。
超级电容器是一种以发生极化电解质的手段来实现存储能量的装置。它传承了传统电容器的充放电快以及使用寿命长等优势,同时也具备了电池的二次充放电的能力。对于超级电容器来讲,要想提高它的存储能力,关键的是设计、合成高性能的电极材料。金属有机骨架(Metal-organic frameworks,MOF)是指过渡金属离子与配体在合适的溶剂中通过配位作用而形成的三维网状骨架结构。MOFs材料具有结晶性能良好、
近些年来,高透明氟氧化物微晶玻璃受到了广泛地研究,相对于其他稀土掺杂材料来说,这是一种新型纳米复合材料,由氟化物纳米晶体和氧化物基质玻璃共同构成。正是由于这种复合结构,使得这种材料不仅有着稳定的结构特性,还拥有优异的发光性能,在荧光显示、LED照明、X射线探测器、医学成像等领域中都有着十分重要的应用。本文实验先采用高温熔融法获得稀土掺杂的硅酸盐玻璃作为基质玻璃,再通过二次热处理制备了包含YF3、L
人体连续动作识别方法在智能家居、体感游戏、群智感知等多个领域发挥着越来越重要的作用。近年来,Wi Fi感知技术由于无需用户携带感知设备,无需与人体进行直接接触,因此侵扰性小,且与视觉和光学的动作识别技术相比,基于Wi Fi信号的识别技术不会受周围环境光照的影响,因此得到了广泛的关注。现有的基于Wi Fi信号的动作识别主要根据接收信号强度(Received Signal Strength,RSS)、
近年来,有机-无机卤化物钙钛矿太阳能电池由于光电转换效率的显著提高而受到广大研究者们越来越多的关注。2009年,Miyasaka等人首次以甲基胺和卤化铅合成了钙钛矿晶体(CH3NH3Pb X3,X为卤素)作为固态薄膜太阳能电池的吸光层,该器件的转换效率最高可以达到3.80%。目前,钙钛矿太阳能电池器件的光电转换效率已经迅速提高到23.30%。在短短几年时间内,钙钛矿太阳能电池的光电转换效率的迅速提