Lasso变量选择的分布式算法

来源 :应用概率统计 | 被引量 : 0次 | 上传用户:huajinxiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Lasso是机器学习中比较常用的一种变量选择方法,适用于具有稀疏性的回归问题.当样本量巨大或者海量的数据存储在不同的机器上时,分布式计算是减少计算时间提高效率的重要方式之一.本文在给出Lasso模型等价优化模型的基础上,将ADMM算法应用到此优化变量可分离的模型中,构造了一种适用于Lasso变量选择的分布式算法,证明了该算法的收敛性;同时,我们通过数值实验,将本文构造的分布式算法与循环坐标下降法和ADMM算法进行了比较分析,结果显示在处理样本集大的稀疏性回归问题时,本文提出的算法的计算时间和误差都小于其他两种算法.
其他文献
为了从甲骨拓片图像中自动提取甲骨字符信息,本文基于深度神经网络构建了一个甲骨字符提取的双分支融合网络(dual-branch fusion network for extracting Oracle characters,EOCNet).EOCNet包含3个基本特点:首先,为了能够利用生成网络较强的结构信息描述能力,EOCNet以对抗生成网络(generative adversarial network,GAN)为基本骨架,将甲骨字符提取问题视为图像到图像的转换任务;其次,为了能利用语义分割网络较强的拓片
以中国知网(CNKI)和Web of Science核心合集数据库为数据源,采用文献计量学方法,借助CiteSpace可视化分析软件,对国内外研究涌潮的国家、机构、作者、载文期刊及关键词等进行分析.在CNKI共检索出433个研究机构的632名作者在239种刊物上发表的652篇文献(1964—2020年),“钱塘江河口”和“长江口北支”是国内关注度较高的区域;“涌潮形态”、“河床演变”、“涌潮压力”和“涌潮高度”等为研究的热点关键词;“涌潮数学模型”和“模型试验”等为涌潮研究的重要手段.在Web of Sc
实时、准确的短期交通流预测是智能交通系统的基础和关键技术之一.由于灰狼优化算法(GWO)存在收敛速度慢、易陷入局部最优解等缺陷,为进一步提升短期交通流预测的精度,提出了基于改进灰狼算法(IGWO)优化支持向量机(SVM)的短期交通流预测模型.首先,本文提出引入帐篷(Tent)混沌序列初始化灰狼种群,更改收敛因子的线性递减公式,对灰狼群体进化差分丰富种群多样性等方法提高算法的收敛速度和收敛精度.之后,通过对8个测试函数的计算,并与粒子群算法(PSO)、GWO进行对比,证明IGWO的先进性.最后,建立IGWO
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输
现有的深度超分辨率重建模型,用堆叠多个相同模块的方式获取具有更高精度的重建结果,但未能充分考虑各层特征间的上下文关联信息.提出一种基于非局部多尺度融合的图像超分辨率重建模型.该模型采用3种模块:非局部模块、多尺度融合模块和宽激活残差模块.其中,非局部模块用于获取图像的全局特征,关注目标的核心区域;多尺度融合模块用于融合通道特征,增强特征在空间的上下文关联;宽激活残差模块替代普通残差模块,通过扩充激活层前的卷积层输出特征来提升模型的重建精度.在5个基准数据集上的实验结果表明,该模型取得了较高的重建精度.在图
本文定义了三类特殊的多维风险统计量,分别是多维共单调拟凸风险统计量、多维拟凸风险统计量和多维经验分布不变拟凸风险统计量,并采用对偶方法给出了它们的表示定理.本文的结果既是一维拟凸风险统计量的推广,也是多维凸风险统计量的拓展.
人口老龄化背景下的长寿风险,将会给国家养老保障体系带来极大的经济负担.如何度量和管理长寿风险,己成为近年来世界各国关注和研究的焦点.本文基于我国人口死亡率数据,在Lee-Carter模型的基础上,引入DEJD模型刻画时间序列因子的跳跃不对称性,并证实了 DEJD模型比Lee-Carter模型在拟合时间序列因子时更为有效.此外,本文利用DEJD模型预测出我国人口死亡率数据,进而给出了 SM债券在我国的市场价格,为SM债券在我国的推广提供了重要参考.
通过实地调研与取样分析,研究、分析了鼓浪屿民国时期历史建筑混凝土构件劣化的现状,从混凝土的原材料、配合比设计、施工质量和外部环境等多角度深入探讨了劣化的原因.研究发现:露筋锈蚀、混凝土性能退化、构件开裂渗水是鼓浪屿历史建筑混凝土构件劣化的宏观表现.劣化混凝土的微观表现为骨料表面仅附着少量水泥浆体,骨料与水泥界面连接疏松,砂浆内部存在较多的孔隙;样品中含有较多的CaCO3、较少的水化硅酸钙及少量的Ca(O H)2,同时伴有少量的CaSO4·2H2 O、高硫型水化硫铝酸钙(Aft)与单硫型水化硫铝酸钙(Afm
对2018年4月6日无为ML4.1地震前的地下流体前兆异常特征以及该地震的震源机制解进行了分析,结果表明,无为地震前的异常分布在距震中64~233 km范围内,这些异常在时间进程上,可分为中期趋势背景异常和短临异常,主要以中期趋势背景异常为主.这些中期趋势背景异常均表现为水位的破年变变化.从空间演化上看,2018年安徽无为ML4.1地震前出现的中期趋势背景异常沿着长江破碎带有序分布.这种比较明显的异常群体性特征为地震预测提供了较好的依据.震源机制解结果显示,节面Ⅰ的走向为NE向,节面Ⅱ的走向NW向.反演的
东濮凹陷上古生界地层油气显示活跃,烃源条件较好,分布范围较广,特别是近年在文留、胡庆地区相继发现自生自储油气藏,展示了上古生界良好的勘探前景.目前上古生界油气勘探还未形成规模储量,尤其是有效储层的地震预测是上古生界勘探的卡脖子技术之一.文中以胡庆地区上古生界储层为例,首先,通过针对性资料处理提升古生界地震资料品质;然后,利用钻井试油结果、精细岩石物理分析与正演模拟,建立上古生界甜点储层识别标准及地震响应特征;最后,采用“分频振幅描河道、联合反演找砂体、频率属性检油气”等递进式技术对甜点砂岩进行预测.甜点砂