论文部分内容阅读
单指标系数模型是一类重要的半参数模型,被广泛应用在经济金融和生物医学等领域,其参数结构是部分变量的线性组合;非参数结构可以灵活的刻画变量间的非线性关系.然而,在实际应用中,有学者发现单指标系数模型中的参数可能会随着时间、空间位点或者其它变量而变化.为了克服这个缺陷,一个行之有效的方法是允许单指标系数模型的载荷系数随着感兴趣的变量而变动,从而直观的刻画响应变量和预测变量之间的动态相依关系,本文称满足这一特征的模型为动态单指标变系数模型.动态单指标变系数模型结合了变系数和单指标模型的优点,既可以动态地描述响应变量和预测变量之间的非线性关系,又可以包含尽可能多的相关变量,从而减小模型偏差.目前,动态单指标变系数模型的相关研究并不多,具有未知连接函数的广义变系数模型是动态单指标变系数模型的一种特殊情况.总的来说,相关文献集中在独立同分布数据或者函数型数据分析中,主要讨论估计量的构造以及大样本性质,但在理论上还存在一些亟待改进的问题,如基于多项式样条得到的估计量的收敛速度要低于最优非参数收敛速度,或者只得到逐点的性质,无法全面了解变系数结构的动态非线性特征.另一方面,缺乏对动态单指标变系数模型在模型检验、变量选择等内容的研究.本文的主要贡献是首次系统地研究了独立同分布数据和局部平稳过程下动态单指标变系数模型的统计推断理论和实际应用,包括给出模型的估计方法以及大样本性质,构造检验统计量来检验模型的适用性,提出模型选择的方法和理论性质,从而提高模型的精确度和有效性.第一章主要介绍研究背景和意义,回顾动态单指标变系数模型的相关研究、局部平稳过程以及非参数估计和变量选择的方法,同时简单阐述了本文的研究内容、文章结构以及创新点.第二章介绍了独立同分布数据下的动态单指标变系数模型的估计方法和模型选择方法,由于动态单指标变系数模型不可识别,基于样条近似的思想,本章提出了一种模型识别的方法,并给出了变系数分量函数和指标分量函数的样条估计.在适当的条件下,本章证明了各分量函数估计的相合性和渐近正态性.值得注意的是,各分量函数估计的收敛速度可以达到最优非参数收敛速度.为了更加准确的描述各分量函数估计的信息,本章还建立了一致置信带.此外,本章构造了L2距离统计量来检验所提模型的适用性,即检验动态单指标变系数模型是否可以退化为单指标系数模型;同时也建立了检验统计量的渐近正态性.为了解决非参数模型“维数灾难”的问题,本章采用SCAD惩罚函数的方法选择出重要的变量,并证明了惩罚估计量的相合性.最后,本章通过大量的数值模拟证实了样条估计量和检验统计量的渐近性质,并将所提出的模型和方法应用于人体脂肪数据和波士顿房价数据的分析中.第三章将动态单指标变系数模型扩展到分位数回归下.众所周知,当数据含有异常点或者误差为厚尾分布时,直接应用第二章的条件均值回归模型会产生较大的估计偏差.但是,在分位数回归下目标函数不可导,这就给研究统计推断方法及性质造成极大的困难.本章基于样条光滑提出了三步估计方法.在适当的条件下,本章证明了各分量函数估计具有相合性,并且首次建立了分位数回归模型下各分量函数估计的渐近正态性.此外,本章采用SCAD惩罚函数的方法识别变量之间的交互效应是否真的为动态的,即检验变系数分量函数是否为常数,并证明了惩罚估计量的相合性.最后,数值模拟证实了本章所提出的方法的渐近性质和稳健性,同时用本章的模型和方法分析了 NO2数据.第四章研究了局部平稳时间序列下的动态变指标系数模型.目前,有许多学者研究了时间序列的非参数建模及其方法,但大多数文献的理论性质是建立在平稳性的假设上.然而,在经济学、金融学等领域中,平稳性假设可能过于苛刻且不成立.本章将平稳性假设弱化至局部平稳序列,这是一类被广泛讨论的非平稳过程.第四章拓展了前两章的模型,允许变系数函数随着指标而改变,是一类更广泛的动态单指标变系数模型;主要研究了局部平稳时间序列下动态变指标系数模型的统计推断理论与应用.本章采用样条后移核算法得到指标分量函数和变系数分量函数的估计.在适当的条件下,本章证明了估计量的相合性并建立了渐近正态分布,但是变系数函数的估计量因为指标函数的影响产生了一个偏差项.另外,本章构造了变系数函数的一致置信带并建立了检验统计量,采用Bootstrap方法检验单个分量函数是否真的具有时变特征.最后,数值模拟证实了本章所提出的方法具有良好的表现,同时将本章的模型用于分析香港环境污染数据.第五章为本文的一些总结和思考,并且指出了文章的不足之处.