高维数据下若干回归模型的变量选择问题研究

来源 :大连理工大学 | 被引量 : 4次 | 上传用户:antoney
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量选择对高维数据的处理起着至关重要的作用.有效的变量选择通过剔除多余的变量能够给出最优的预测变量,从而得到最简洁的模型.同时,有效的变量选择能够提高模型的预测精度.自Tibshirani(1996)提出Lasso惩罚方法以来,基于惩罚思想的变量选择方法受到了广大统计学者的广泛关注.惩罚方法能够在选择变量的同时得到参数的估计且惩罚方法的计算量也小很多,因此惩罚变量选择方法在处理高维数据时有着比传统变量选择方法无可比拟的优越性.本文给出了我们关于高维变量选择研究取得的一些成果.本文的内容可以分为三部分.第一部分是关于高维参数模型的变量选择问题.本文第二章和第三章给出了有关高维广义线性模型和最小二乘近似的理论结果.同时,通过数据模拟和实例分析对估计的效果和变量选择的有限样本表现进行验证.此外,第四章还研究了参数个数发散和参数个数远大于样本量两种情况下最小一乘回归的变量选择.在一定条件下,证明了SCAD惩罚最小一乘估计具有Oracle性质.数据模拟和实例分析也很好的支持了我们的理论结果.第二部分是关于高维半参数模型的变量选择.第五章利用桥惩罚函数对部分线性模型的线性部分进行变量选择.在适当的条件下,证明了参数部分的桥惩罚估计具有Oracle性质.同时,证明了桥惩罚的使用并没有影响非参数部分估计的收敛速度.数据模拟和实例分析说明桥惩罚的变量选择效果是非常好的.第三部分是关于I型区间删失数据的变量选择问题的研究.本文第六章主要研究了高维现状数据下连续广义线性模型的变量选择问题.利用SCAD惩罚函数对现状数据中的自变量进行选择.给出了参数个数发散时参数的惩罚估计的最优收敛速度.当调整参数满足适当的条件时,该方法能够一致地选出真实模型.显著变量的估计具有和真实模型下参数估计相同的渐近分布.最后的数据模拟和实例分析结果说明删失数据下惩罚似然估计的表现也非常理想.
其他文献
<正>定价:49.00元ISBN:978-7-117-26648-2为了使广大群众对子宫颈癌从发病到防治有比较全面的了解,主编组织全国知名的妇产科、妇女保健、流行病学共36名专家编写了这本科普
在我国高等学校教学体系中,数学学科占据着十分重要的地位,是理科、工科、轻功类学科、计算机以及金融类专业的必修科目,也是一门基础性较强的科目,对于大学生的专业知识的掌
央企混改正在进行中,据近日媒体报道.第二批混改试点或即将公布。中国证券报报道称,中国联通计划通过增发A股融资,互联网BAT三巨头(百度、阿里巴巴、腾讯)以及其他国企有望成为联通
期刊
过去千年是古气候研究中具有特殊意义的时间段,湿度变化对干旱区生态环境状况和社会经济发展具有尤为显著的影响。我国内陆干旱区缺乏年代可靠、指标意义明确的高分辨率记录,不
以台北女性为主体 ,从健康、美丽以及权力等三个角度切入 ,探讨台北女性以何种身体观 ,如何透过身体的知觉与实践来呈现自我 ,如何创获运用其经济与文化的资本 ,在社会场域中
目的:观察环磷腺苷联合生脉注射液治疗慢性心力衰竭的疗效。方法:80例慢性心力衰竭的患者被随机分成观察组40例,对照组40例,两组常规治疗相同。观察组给予环磷腺苷40mg,加入5
作为美学家的丹托在介入当代艺术批评之后,相当努力地为当代艺术找到了其完全区别于西方传统艺术和现代艺术的"审美性",也即"第三领域的美"。本期王瑞芸的西方当代艺术理论前
江苏理文化工有限公司烧碱扩建项目已进入设备安装阶段,预计2009年年初投产。江苏理文化工有限公司主要生产烧碱、甲烷氯化物等化工产品。公司规划烧碱装置要达到16万t/a的规