基于单个特征分类准确率的特征选择方法研究

来源 :南京林业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:quhaoshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】随着遥感技术迅猛发展,在影像解译过程中提取的信息越来越繁杂多样。为提高地物分类准确率,常加入更多的特征信息,而由此往往造成一定的信息冗余,导致分类效率甚至准确率降低。笔者利用随机森林(RF)和支持向量机(SVM)分类器,探索在遥感分类过程中保证分类精度的同时又能降低特征维度的方法。【方法】以吉林省安图县福兴林场部分区域为研究对象,利用2015年Landsat-8影像为数据源,提取光谱信息(红、绿、蓝、近红外和短波红外波段)、植被指数(NDVI、增强型植被指数、比值植被指数和裸土植被指数)、纹理(同质性、均值、二阶矩、方差、差异性、对比度、熵和相关性)和地形信息(坡度和坡向)共19个指标作为分类特征变量。以RF分类器估测的特征重要性进行特征选择为对照,分别以单个特征在RF和SVM两分类器中的分类准确率为依据进行特征选择,并对选取的特征进行主成分分析,与未做主成分分析的进行区分,再分别用RF和SVM分类器进行分类,评价分类精度,确定最优特征和分类器组合。【结果】①基于SVM单个特征分类准确率选取特征,对选取的特征进行主成分分析,再用RF进行分类,该方法与其他方法相比分类性能最好,当特征维度为5时,总体精度为0.86,Kappa系数为0.83;与输入全部特征进行分类相比,不仅提高了分类精度,而且降低了特征维度,使分类效率得以提升。基于RF特征重要性选取特征的RF分类取得了较高的分类准确率,但特征维数小于7时,分类准确率波动较大;在特征维数为4时分类准确率增至最大值(0.88),随后骤降为0.83,之后基本保持在此水平。而基于单个特征分类准确率选取特征,分类准确率变化较为平缓,如上所提最优分类性能方法的分类准确率波动范围基本在0.02。②基于单个特征在RF和SVM分类器中的分类准确率进行特征选择,在随后的分类过程中,SVM分类器分类精度总体高于RF。基于RF单个特征分类准确率选取特征的SVM分类,及基于SVM单个特征分类准确率选取特征并对选取特征进行主成分分析的RF分类,较仅利用SVM或RF单个分类器选取特征并分类的分类准确率更高。【结论】①基于单个特征分类准确率的特征选择方法,可在保证分类精度的同时降低特征维度,且在较低维度时,基于该方法选取特征的分类精度较基于特征重要性选取特征的分类精度更稳定。②基于单个特征分类准确率进行特征选择,不同分类器选取的特征有所差异,分类准确率也不同,利用多个分类器较单个分类器选取特征并分类的性能更好。③在中低维度时,RF分类器的分类准确率可能与特征输入顺序有关,对输入特征进行主成分分析有利于提高分类器的分类精度及稳定性。
其他文献
目的探讨雌激素受体(ER)和(或)孕激素受体(PR)阳性乳腺癌术后肝转移患者的临床特征及预后因素。方法选取140例激素受体阳性乳腺癌术后肝转移患者,分析其临床特点及预后相关因
由于社会转型期民主法治尚未定型与成熟,基于公权力的公信力危机,我国群体性事件面临着定性困惑,由此也注定了其处置的困境所在。国家的政策取向应当从压力维稳型向改革维稳
企业进行合并主要有两种处理方法,即购买法与权益结合法。本文将从主体思路、具体处理方法、操作效果三个主要方面进行比较和讨论,论述两种处理方法在实际应用中的优势和缺陷
经济发展新常态会促使零售企业自身进行软硬件的升级,落后的管理模式、缺乏技术含量的零售企业必将会在新常态经济发展下被淘汰出局,要想在经济新常态形势下有所发展,零售企
铁路在近代中国是一个新鲜事物,其经营管理更是一项崭新的事业,多数铁路亏损较多,沪宁铁路运营直到1916年才有了盈余,逐渐成为经营优良的线路,其以人为本、优质服务、安全管
甜樱桃外观诱人,营养丰富。大连市甜樱桃栽培历史悠久,且生产的甜樱桃品质优良,广受市场欢迎,有很高的经济效益。但甜樱桃的果实收获期短,销售窗口大。因此甜樱桃的保鲜方法
目的基于治疗前后血清白细胞介素-4(IL-4)、白细胞介素-5(IL-5)、白细胞介素-6(IL-6)及免疫球蛋白E(IgE)水平的变化评价止咳贴穴位敷贴干预小儿咳嗽变异性哮喘的临床疗效。方
就建筑行业而言,建筑项目的投资较为复杂并且工程的施工期比较长,这样整个建筑工程在施工过程中会有巨大的风险;而对于发包人而言,建筑项目中最大的风险就是合同法风险。只有
本文采用我国31个省份的面板数据,通过建立Panel Data模型,实证研究农村居民收入结构对消费行为的影响,研究表明:不同性质的收入对消费的促进作用是不同的,而且具有区域性差