基于稀疏表示的特征选择算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:sjlovedq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别学科中,特征选择作为其范畴内的一个重要方向,已经演变成近些年来的学习热点。在现实生活中,科学研究的成果已经渗透到很多行业,并在行业中获得实际应用。在学科研究和现实生活应用中,将会面对和处理庞大的数据。该数据往往样本数不多,但是其数据维数很大并且冗余特征多,对计算机的处理资源和处理实时性是很大的挑战,解决“维度灾难”的问题有非常重要的作用。所以特征选择作为数据处理的重要步骤,发挥关键的作用。由于维度过大的原因,高维数据的回归问题是一个比较大的挑战,一个有效的解决方法就是特征选择。而基于稀疏表示的线性回归已经被证明在处理高维数据时非常有效。传统的稀疏表示的线性回归算法有Lasso算法,Lasso算法通过最小化目标函数,用系数的绝对值作为压缩模型的系数,使得绝对值比较小的系数被压缩为0,这样就可以去掉很多不重要的特征。由于Lasso在特征选择方法上的优点,得到了广泛的认可和使用。为了解决高维数据所面临的特征选择问题,本文是在稀疏表示的线性回归模型上,进一步深入进行研究。结合Lasso线性回归模型,提出了具有辨别信息的特征选择模型,其特征变量与特征变量有很少的重复性,同时特征变量与响应变量存在很大的相关性。同时,基于Lasso模型,提出一种特征交互性特征选择方法。所选择特征体现了协变量和响应集变量高阶交互信息。本文在多个公开的数据集上进行测试。从实验测试结果中可以看出,提出的模型对于特征选择任务的分类准确性有了明显的提升。
其他文献
<正>在如今音乐行业的大环境下,商业演出的重要性难以取代,也是大部分音乐家生存的必须手段;然而在商业演出以外,真正热爱爵士乐的自发组织力量往往会大大提升一方土壤的爵士
目的 采用温度稀释法(PiCCO系统)单肺通气(OLV)下急性高容量血液稀释(AHHD)对犬血管外肺水(EVLW)的影响,并应用重量分析法验证其结果的准确性。方法 16只健康成年杂种犬,随机分
问:国人脚气的发病情况如何?
常规增强型地热系统(EGS)通过流体工质在裂隙热储中的循环流动来开采岩石中的热能,需要消耗大量的泵功,存在工质流失、管道腐蚀结垢等问题,而且常常由于裂隙网络的井下连通性不
<正>天命玄鸟,降而生商,经过13次迁都后定都安阳的商王朝自此走向强盛,点燃了中华文明的第一粒火种,城市之光推进了一轮轮的朝代更迭,伴着一粥一箪、车马粼粼,生生不息,代代
现阶段我国的经济水平得到了显著提升,人们对汽车的拥有数量也在逐年增长,汽车使用过程中会受到多种因素影响存在着故障,影响车主的正常使用。汽车发动机的维修过程中,发动机
产业蜕变作为一个客观存在的规律,是在每一个产业的成长中一定要经历的过程,是对产业逐渐实现由数量上的增减变化到发生根本性变化的发展过程的客观呈现,它可以被看作演化着
近年来,我国可再生能源发展迅猛,但电力“供-输-需”的失衡造成严重的窝电和弃风弃光现象,可再生能源无法得到更大规模开发和有效利用,导致能源绿色转型步伐缓慢,质量偏低等问题。针对这些问题,本文将我国分为六大区域,设定三种电力需求情景,考虑六种发电技术、九种输电技术;兼顾停电事故对输电网造成的电量损失最小目标和发电装机、跨区域输电主干线路建设的综合成本最小目标,建立输电主干线路布局多目标优化模型。同时
<正> 哌嗪芳环尼龙是用哌嗪、苯甲酰氯和少量甲苯二异氰酸酯通过界面缩聚合成的: 聚合物为含有少量聚脲结构的共聚酰胺,将这一聚合物溶在二氯甲烷/甲醇、三氯甲烷/乙醇或二氯
本论文是在国家自然科学基金(No.51675258,51265039,51075372)、机械传动国家重点实验室开放基金(No.SKLMT-KFKT-201514)资助下,针对目前工程实际中日益显现的转子系统盘轴松