非参和半参回归模型的稳健和截面推断

来源 :山东大学 | 被引量 : 5次 | 上传用户：marriamirror

【摘要】

：

在识别响应变量和预测变量的回归结构问题中,非参和半参回归模型因其良好的灵活性和(或)较好的可解释能力已经得到了深入的研究和广泛的应用.半参模型中部分线性模型是为一类

【作者】

：

李锋

【机构】

：

山东大学

【出处】

：

山东大学

【发表日期】

：

2010年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在识别响应变量和预测变量的回归结构问题中,非参和半参回归模型因其良好的灵活性和(或)较好的可解释能力已经得到了深入的研究和广泛的应用.半参模型中部分线性模型是为一类常用的模型,它既保持了非参数模型的灵活性同时有具有参数模型良好的可解释性,特别的它还有效的避免了纯非参回归的“维数灾难”问题(curseof dimensionality).近年来,在实际的医疗数据分析中,协变调整模型和变量选择问题已成为热点问题,引起了人们的极大关注.然而,非参回归模型中,普通核估计方法对窗宽选择敏感并且收敛速度也不尽如人意；协变调整的部分线性模型未有研究；如Fan和Li(2004)指出的部分线性模型的变量选择问题也少有研究.本篇论文中我们就针对这些非参和半参回归模型的相关问题进行研究.具体的,本篇论文的基本思想如下.　　已有的研究成果表明非参回归函数的普通核估计量可以近似的表示为,从上面的表达式我们发现了一种新的回归关系,r(x)可以看做(r)hj(x)对hj回归的截距项,因此我们可以重构线性回归模型　　并通过加权最小二乘法得到r(x)的估计.新的估计量结构简单并且尽管不使用高阶核仍然具有较小的均方误差.结果如下,　　最优窗宽的阶数为O(n-1/9).进而我们发现虽然采用的窗宽hj不是最优的,但在满足条件hj=O(n-α)且有1/10<α<1/5成立时,新估计量(r)(x)仍具有比普通核估计量更小的均方误差.由此说明新估计量对窗宽选择稳健.此外,在一些正则条件下,我们还得到了新估计量的渐近正态性,　　因此,论文第二章中通过联合非参回归和参数回归提出的两步估计(三步估计)能够就窗宽选择和收敛速度的意义上改进非参数估计.更一般的,我们的方法可以推广到一般的非参估计以及非参数回归模型,例如我们还把此方法推广到了多元非参回归模型,可加模型.　　受Sentürk and Miiller(2005)提出的协变量调整回归(covariate-adjusted regres-sion(CAR))问题和另一实际问题(在研究钙缺乏的问题中,需要研究钙吸收量和钙摄取量之间的关系,同时还要考虑体征指标(body mass index)和年龄因素的影响)的启发,在第三章我们介绍并深入研究了协变量调整部分线性模型(covariate-adjustedpartially linear models(CAPLM)),　　其中真实的响应变量Y和预测向量X是观测不到的,我们只能观测到它们被乘子()(U)和φr(U)污染以后的变量Y和X,同时还考虑了时间T的影响.虽然我们的模型看起来像足Sentürk(2006)提出的协变调整变系数模型(covariate-adjusted varyingcoefficient models(CAVCM))的特例,但实际上CAPLM和CAVCM所处理数据的类型有着本质的不同.在某一固定观测时刻有来自多个个体的观测是Sentürk(2006)第一步估计方法的关键,而我们所研究的数据在固定观测时刻则可能仅有一个观测.因此,两种模型的推断方法是不同的.如Cui et al(2008)指出,　　由此我们可以给出()(U)和φ(U)的非参估计,并近似恢复真实的不可观测的Y和X.接下来,用恢复的数据来替换不可观测的真实数据,通过截面最小二乘法可以给出参数β的估计.并且,在一些温和的条件下我们还得到了参数估计量的渐近正态性,细节可参看3.3节.此外,我们还给出了回归系数的置信域.　　随着科技的发展,人们获取和存储高维数据集(即变量的个数p相当或者远大于样本容量n)变得更加方便.变量选择在高维数据分析中发挥着至关重要的作用,Dantzigselector是线性和广义线性模型变量选择方法中的一种.在第四章我们将研究部分线性模型的Dantzig selector变量选择问题,它的定义如下,其中(X)和(Y)分别为中心化的设计阵和中心化的响应观测矩阵.我们得到了Dantzigselector的大样本性质.即n趋于无穷,p固定时,在合适的条件下有(β)→Pβ0,其中β0为优化问题　　的解.我们还注意到Dantzig selector并不一定是相合的.为了克服此不足,我们采用Dicker和Lin(手稿)提出的adaptive Dantzig selector变量选择方法.部分线性模型adaptivc Dantzig selector定义为,　　进而,我们得到在合适的条件下部分线性模型adaptive Dantzig selector参数估计量具有oracle性质.即n趋于无穷,p固定时,在特定条件下有adaptive Dantzigselector估计量足模型相合的,并且有Adaptive Dantzig selector作为Dantzig selector的一般形式,它们都可以采用Jameset al.(2009)提出的DASSO算法来解决最优化问题.文章还讨论了调整参数和窗宽的选择方法.　　综上所述,本篇论文进一步研究了非参和半参回归模型的相关问题.首先,对非参回归模型,我们提出了一种稳健的纠偏估计方法,新的两步(三步)估计量对窗宽选择稳健,并且不用高阶核就具有比普通核估计更快的收敛速度,均方误差阶数为O(n-8/9).其次,我们研究了协变量调整的部分线性模型,给出了模型的推断方法,并且得到了参数部分估计量的渐近正态性和置信域.最后我们研究了高维部分线性模型的变量选择和参数估计问题.当样本容量n趋于无穷,变量个数p固定时我们研究了Dantzig selector参数估计量的大样本性质,并得到了adaptivc Dantzig selector参数估计量的oracle性质.　　模拟实验和实际数据的应用进一步阐释了文中介绍的各种方法.

其他文献

辅导员工作的多层次模糊综合评价数学模型

辅导员是高校大学生思想政治教育工作的骨干力量，是保证高等教育事业持续健康发展不可或缺的重要力量。科学合理地评价辅导员的工作业绩，是激励辅导员认真履行岗位职责、提高学

学位

高效辅导员教育评价层次分析法模糊数学

广义随机非线性算子问题

非线性算子的不动点理论是非线性泛函分析的重要组成部分,尤其是非线性不动点的迭代逼近问题已成为学术界近年来研究的热点课题之一.众所周知,在研究随机不动点问题中,解的存

学位

非线性算子随机不动点广义Lipschitzian随机算子Banach空间压缩随机算子

离散时间休假排队系统若干研究结果

排队论在电子通信、物流管理、交通运输、医疗救助、银行服务与生产线等许多领域具有广泛的应用。二十世纪七十年代,出于有效利用空闲服务台的观点,服务员休假的思想被引入到

学位

离散时间休假排队系统概率母函数Markov链法再生循环

函数空间以及函数下方图形超空间的拓扑结构

本文主要证明了一些函数空间组以及函数下方图形超空间组同胚于常见的无限维模型空间组.　　令(X,d)为一个度量空间.实单值函数f：X→R称为是上半连续的,如果对每个t∈R有f-1(-

学位

函数空间超空间组拓扑结构上半连续线性映射

一维可压缩粘性热传导气体光滑解的整体存在性

Navier-Stokes方程组是描述流体物质运动的模型，在数学、物理等科学领域具有非常重要的作用。目前，已经有许多数学和物理研究人员对Navier-Stokes方程组进行了深入的研究并取得

学位

Navier-Stokes方程组自由边值可压缩粘性热传导气体整体存在性光滑解温度增长指数插值不等式

两类复杂网络动力学模型及其性质研究

考虑到疾病的潜伏期以及人体对疾病的非持久性免疫,本文在现有模型的基础上，基于复杂网络构建了两类新的动力学模型:SLIS模型和SIRS模型。运用微分方程稳定性理论、LaSalle不

学位

疾病传播动力学行为复杂网络平衡点存在性稳定性

若干图类的拉普拉斯谱

图谱理论是图论研究中一个重要而活跃的领域，通过研究图的各类矩阵的特征值等代数不变量，刻画图的性质如连通度、直径等，是图谱研究中的一个主要问题.而其中尤为重要的是对图的

学位

拉普拉斯谱半径二部图边移植变换图图谱理论

非参和半参回归模型的稳健和截面推断

其他学术论文