复杂数据下半参数模型的统计推断

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:xpzcz1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半参数回归模型是二十世纪八十年代发展起来的一类重要统计模型,既含有参数分量.又含有非参数分量,可以概括和描述众多的实际问题.它比单纯的参数回归模型或非参数回归模型有更大的适应性,并具有较强的解释能力.在实践中,我们经常会遇到各种各样的数据,如缺失数据、测量误差数据、删失数据、纵向数据等复杂数据.因此,研究复杂数据下半参数回归模型的统计推断具有理论意义和实用价值.目前,此类问题已经成为统计学界研究的热点课题.   本文主要研究半参数模型中回归系数和基准函数的估计理论、方法以及其相关问题,考虑各种复杂数据,如缺失数据、测量误差数据、删失数据、纵向数据等等.   首先,研究了缺失数据下的部分线性模型回归系数和基准函数的置信域和逐点置信区间的构造问题.分别在协变量随机缺失和响应变量随机缺失的情形下进行研究.对协变量随机缺失下的部分线性模型,构造了模型中回归系数的经验对数似然比统计量.在适当的条件下,证明了所提出的统计量依分布收敛于x2分布.通过极大化经验对数似然比函数,获得了未知参数的极大经验似然估计,证明了该估计的渐近正态性.同时,研究了基准函数的经验似然推断问题,证明了所提出的经验对数似然比渐近于x2分布.模拟研究比较了经验似然与正态逼近的有限样本性质,并进行了案例分析.对响应变量随机缺失下的部分线性模型,先对缺失数据进行线性回归借补,然后构造回归系数和基准函数的经验对数似然比统计量,讨论了所提出的经验对数似然比统计量的渐近性质,模拟研究表明经验似然方法优于正态逼近方法.   其次,针对响应变量随机缺失下的部分线性EV模型,提出了回归系数和基准函数的两步估计方法.研究了回归系数估计的渐近正态性,证明了基准函数估计的相合性并达到了非参数估计的最优收敛速度Op(n-(?)).为了构造回归系数和基准函数的置信域和逐点置信区间,本文考虑了回归系数和基准函数的经验似然推断.对参数部分,在适当条件下,证明了所提出的经验对数似然比渐近收敛到一个自由度为1的独立x2变量的加权和.为了提高估计的精度,引入调整因子,使得调整后的经验对数似然比依分布收敛到x2分布.对非参数部分,构造了未知函数的经验对数似然比统计量,证明了该统计量的渐近分布.根据所得的结果,可以构造回归系数和基准函数的置信域和逐点置信区间.模拟研究了本文所提出方法的有限样本性质,并分析了AIDS数据.   再次,利用经验似然方法研究了删失数据下回归模型的拟合优度检验.先对删失数据进行变换,然后采用经验似然方法构造检验统计量,证明了所提出的经验对数似然比检验统计量依分布收敛到自由度为1的独立x2变量的加权和.为了提高检验的功效,引入了调整因子,使得调整后的经验对数似然比检验统计量渐近于x2分布.同时,讨论了经验对数似然比检验的功效,模拟研究了所提出方法的功效.   最后,考虑了纵向数据下部分线性EV模型,基于计数过程构造了参数β的估计函数,采用SCAD惩罚定义了β的惩罚估计函数,通过解惩罚估计方程得到β的估计.用局部二次逼近,给出了解估计方程的迭代算法.同时,将所提出方法推广到了其它情形.在一些正则条件下,通过适当选择调整参数,证明了所提出的估计具有oracle性质.进一步,讨论了纵向数据下参数维数发散的部分线性模型的变量选择问题.采用SCAD惩罚同时进行变量选择和估计未知参数,在一定条件下,证明了所得估计具有orcale性质.除此之外,给出了同时进行变量选择和估计过程的迭代算法,也讨论了如何选择SCAD惩罚函数中调整参数λ.
其他文献
二十世纪六十年代以来,图论获得了空前发展,在物理学、化学、计算机科学等学科中得到了广泛应用。图的因子理论是图论的一个重要分支,也是图论研究中最活跃的课题之一。   本
学位
曲线插值问题是CAGD中一类基本问题,对于参数曲线,实际应用中不但要求插值一个有序点列,而且要插值这些点处的若干阶导数。古典的Hermite插值可以获得具有高阶精度的参数曲线
群众工作是党的工作的重要组成部分,是企业发展的重要保证。多年来,江苏油田党委努力做深、做活、做实群众工作,促进了队伍的团结稳定和群众积极性、创造性的发挥,确保了油
水文地质参数的研究对地下水的合理规划、水资源评价、利用和开采都有着重大影响。解析法是求解水文地质参数最基本、最重要的方法,故对地下水渗流模型解析解的性态和参数灵
期刊
近年来,拟小波数值方法已经被广泛地用于求解偏微分方程,具有全局的高精度和局域的稳定性。本文回顾了拟小波的理论。我们对它的变种—区间拟小波感兴趣,因为它既有拟小波的优良
在这篇文章中主要研究小波级数的点态收敛性.   全文分为两个部分,第一部分讨论当函数f(x)满足某些条件时,它的多尺度展开式在频率空间中的几乎处处收敛性.   第二部分讨
期刊
设N,t,k,v,入为正整数,其中2≤t≤k.一个大小为N,强度为t,度为k,阶数为v,指标为入的覆盖阵列,记为CAλ(t,k,v),是一个取自v元符号集X上的Nxk阵列(表),使得它的每一个Nxt阵列包含任意的X上的t
样条函数是曲线曲面设计的一个非常重要的工具,它被广泛的应用在计算机辅助几何设计领域和工程数学领域之中。有理样条函数作为样条函数和有理逼近的结合,更是兼顾了样条函数和