论文部分内容阅读
在过去的几十年里,随着科学技术的高速发展和数据搜集能力的不断提升,在金融、经济、生物信息、医学、气象环境学、人体运动学等领域中涌现出大数据,特别是以曲线形式存在的函数型数据(Functional Data,FD).因为FD是在时间、空间或者其它维度上的连续函数,这使得传统的多元分析方法不再适用.因此,函数型数据分析(Functional Data Analysis,FDA)是当前学术研究的国际热点与前沿问题之一.函数型回归模型是FDA中重要的工具之一,受到了众多学者们的广泛重视.其研究结果不仅丰富了FDA的理论知识,还为其在各个领域的应用奠定了基础.本文主要围绕函数型回归模型的统计推断和应用问题进行研究,主要工作如下:(1)讨论了函数型线性模型在金融领域的应用问题.通过对美国个股期权隐含波动率曲线的研究,我们发现有些曲线呈现出既不是线性也不是二次曲线的奇异形状.这促使我们基于观察到的期权价格数据,用一些非参数平滑方法去拟合隐含波动率曲线,从FD的视角研究其经济决定因素.我们提出了函数型Fama-Mac Beth回归方法,该方法首先建立横截面上的函数型回归模型,随后给出了函数系数逐点的检验统计量和置信区间.我们利用1996年1月―2015年12月的期权和股票数据进行实证分析,并把结果与隐含波动率影响因素已有的结果相比较,以凸显我们提出方法的优点.(2)讨论了部分函数型线性模型中误差项的序列相关检验问题.实际问题中,金融和经济数据常常带有序列相关性,若直接对其进行建模,则将会使模型的拟合效果和预测精度大打折扣.首先,我们用函数型主成分分析方法(Functional Principal Component Analysis,FPCA)把无穷维的函数型协变量降到有限维空间.然后,把标量数据线性回归模型的序列相关检验方法推广到函数型线性回归模型中,并推导相应的大样本性质.最后,用数值模拟说明提出检验统计量在有限样本下的表现,并且通过美国住宅用电量数据的实证分析来说明它们的有效性.(3)讨论了误差项带有自相关的多元函数型线性模型的变量选择问题.当自变量包含多个FD,且响应变量带有序列相关性时,模型的构建和估计具有很大的挑战性.我们运用FPCA把无限维的函数型自变量降到有限维空间,基于Group Smoothly Clipped Absolute Deviation(Group SCAD)准则,同时对函数型自变量系数和自相关系数进行变量选择和参数估计.在一定的正则性条件下,证明了模型选择的相合性和自相关系数估计量的渐近正态性.此外,通过数值模拟验证了我们提出方法良好的有限样本性质.(4)讨论了高维部分函数型线性模型中线性部分系数的全局检验问题.在实际应用中,我们常常会遇到FD和高维数据的混合数据.因此,本文运用FPCA对函数型协变量降维之后,在原假设和局部备择假设下,构造U-type检验统计量.在一定的正则性条件下,证明了提出检验统计量的渐近正态性.模拟研究结果和空气污染数据的实证分析验证了提出检验方法在有限样本下的良好性质.