基于变量聚类的主成分Lasso降维算法与模拟

来源 :统计与决策 | 被引量 : 0次 | 上传用户:xinyang101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在较高维度下的特征集合中如何筛选出重要子集是统计学中经常遇到的问题,而利用建立合适的稀疏模型使得模型复杂度降低的方法是近年来各领域学者研究的热点.文章基于在模型建立前考虑存在因高维自变量间的高度线性相关性而具有的组结构特性问题,提出了一种新的基于变量聚类的主成分Lasso(简记为VPLasso)降维算法.数值模拟结果表明,当模型中自变量同时具有组间稀疏和组内稀疏两种特性时,提出的降维算法不仅在回归参数的估计精确度上,而且在变量选择准确性上都优于经典的组结构特征选择算法.
其他文献
介绍了一种参照JJF 1101-2003《环境试验设备温度、湿度校准规范》,以C51语言编程MCU控制9个DS18B20传感器的硬件电路为下位机;以Python编程笔记本电脑控制为上位机的温度智
九十三岁的著名棋坛老帅谢侠逊先生,现在是上海市文史馆馆员,专事中国象棋的研究工作。前不久,我在上海西宝兴宝山新邨访问了谢老先生。当时,他刚跨进家门,虽然面有倦色,但
文章采用Malmquist-Luenberger生产率指数模型对中国省域环境全要素生产率进行测算,在此基础上运用空间计量模型探究了环境全要素生产率的空间溢出效应.结果表明:环境技术进
互联网医疗是国家积极鼓励发展的医疗模式,而线上医患交流是互联网医疗的重要一环.新冠肺炎疫情期间,线上医患交流受到广泛关注,开始成为人们重要的医疗补充方案.基于对线上
随着中国经济发展水平的不断提高,环境分权对环境污染的影响有了新的变化,且这些变化多与地方政府竞争有关.文章利用2007-2018年省际面板数据,运用空间杜宾模型和空间面板分
我决心要给王书记提意见了。给领导提点意见,在过去本来是一件很简单很正常的事。可是,这几年由于党的传统作风受到破坏,也由于我优柔寡断,在思想上经过许多复杂的矛盾和斗
文章对评价环境效率的SBM模型适当改进,引入了窗口分析方法处理技术不变假设下环境效率的动态评价问题.以中国30个省份2005-2017年统计数据为依据,评价结果发现各省环境效率
文章以中国交通运输业经济发展与行业二氧化碳排放的关系为研究对象,基于1997-2017年的统计数据,在考虑空间效应的基础上,构建了环境库兹涅茨曲线的空间计量检验拓展模型,对
第一次全国工农教育会议指出:开展工农教育是巩固和发展人民民主专政,建立强大的国防军和强大经济力量的必要条件;指出目前工农教育的实施对象应首先着重在工农干部和工农中
新墨西哥原子弹实验以后不久,就从柯达公司(Eastman Kodak Co.)传来消息,说贴照片用的纸板,都被放射线所毁坏掉了。制造纸版的工厂有两个,都在 Mi dle West 地方,相隔五百哩