超高维部分线性模型的PGFR变量筛选

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:shliukan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分线性模型是一类重要的半参数回归模型,结构是将线性模型与非参数模型相结合,既保留了参数回归模型容易解释的优点,又保留了非参数回归模型灵活性的特点,可以更好地拟合数据.随着科学技术和计算机的快速发展,数据收集变得越来越容易,超高维数据频繁的出现在生物医学、工程研究、金融等各个领域,如何处理和分析这些数据成为目前具有挑战的前沿问题.在超高维数据下,针对线性回归模型的变量筛选研究已经很多,而部分线性模型更多的还是在低维数据下进行研究,因此研究超高维部分线性模型的变量筛选具有理论意义和实际意义.  本文主要考虑超高维部分线性模型,其中线性部分的维数p远远大于样本量n,且维数p随着样本量n呈指数阶增长.为了有效的进行变量筛选,根据截面向前回归(profiled forward regression,简写为PFR)算法,考虑到协变量之间的相关性,本文提出了profile贪婪向前回归(profile greedy forward regression,简写为PGFR)算法.从模拟研究和实例分析,可以看出PGFR完成的是非常有效的.  本论文的研究工作主要有以下两个方面:  1.针对超高维部分线性模型,首先基于半参数回归的profile方法,把超高维部分线性模型转化成超高维线性模型.其次,为了对高维线性分量进行有效的变量筛选,考虑到协变量之间的相关性,提出了PGFR变量筛选方法.在一定正则条件下,证明了所提PGFR变量筛选方法具有筛选相合性.为了确定所选模型是否能够依概率趋于1包含真实模型,进一步提出了BIC准则,并证明了BIC准则能够依概率趋于1选择真实模型;  2.针对PGFR变量筛选方法,本论文将考虑在每次做变量筛选时,选入2个或4个协变量进入模型作为重要变量的情况.首先通过三个不同的例子进行数值模拟,观察所得结果,发现筛选重要变量具有有效性.然后将本方法分别与PFR、确定性独立筛选(sure independence screening,简写为SIS)和迭代确定性独立筛选(iterative sure independence screening,简写为ISIS)方法进行对比分析,发现在协变量间共线性较强或者模型信噪比较低时,每一次选入4个协变量进入模型的效果更好.为了验证本文所提出的PGFR方法的有效性,我们对一个实际数据进行分析,并和PFR、SIS和ISIS方法进行对比,发现所提方法能够有效完成变量筛选.  最后,给出结论与展望,概述了本论文所获得的主要研究成果和创新点,并指出进一步研究的问题和方向.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
以瓠瓜、一串铃冬瓜、黑籽南瓜、丝瓜、金丝瓜及日本南瓜F1为砧木,以哈密瓜类优良品种金凤凰为接穗,进行嫁接亲和性及无土栽培试验研究。结果表明,一串铃冬瓜、黑籽南瓜、日
提出了一种基于策略的移动设备安全应用框架,该框架采用XML描述访问控制策略,并结合身份认证、信任连接等安全机制实现对设备自身资源以及设备对网络服务的安全访问,使得用户
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
中国装备制造业国际竞争力研究摘要随着我国工业化和经济全球化进程的加快,装备制造业在国民经济发展中的地位和作用日益凸现.然而,与消费品制造业相比,我国装备制造业发展相
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
中国农村老人以家庭照料为主,妇女承担了主要的照料责任,政府减少对老年照料的支持以及老年人口的快速增长将会加重女性的照料负担。本文利用2002、2005年“中国老年人健康长寿影响因素调查”(CLHLs)数据研究了照料父母对农村已婚妇女健康的影响。在中国农村,与不照料父母的妇女相比,照料父母的妇女“自评健康状况非常好”及“自评健康状况好”的概率将降低7.4%;与配偶健康水平较差的妇女相比,配偶健康水平好的妇女,“健康状况非常好”、“健康状况好”的自评概率将提高33.77%。
盲水印的基本思想是恢复嵌入信息时,不需参考主数据.已有的盲水印技术或是受到主数据的很大干扰,或是需要很大的存储花费.文章提出了基于周期函数的盲水印方案的一般方式,很
20世纪90年代以来,随着科学技术的飞速进步和生产力的发展,企业的管理思想和模式经历了从“纵向一体化”向“横向一体化”的转变过程。“横向一体化”的管理模式强调利用企业外