论文部分内容阅读
变系数模型(Varying coefficient model)(也称为函数系数模型Functional coefficient model)是一般线性模型的一种有用推广。由于变系数模型能够涵盖许多常见的模型,因而引起了许多统计工作者的研究兴趣。变系数模型既部分保留了非参数回归的特点,又具有结构简单、模型容易解释等优点,因而在生物、医学医药研究、经济金融等领域的统计分析中得到了广泛的应用。本文尝试用小波方法对变系数模型进行研究。小波作为一种技术,最初主要用于地震数据分析,后来随着其理论的发展,在图象处理、信号分析、数据压缩等方面也有了广泛的应用。但小波应用于统计还是上世纪九十年代初的事,由于小波理论为数理统计工作者提供了强有力的新技术,具有种种优良性,因而在统计领域得到了广泛的重视与应用,尤其近几年小波在统计学的应用方面的有关研究有了飞速的发展。本文首先研究了Hastie和Tibshirani(1993)提出的变系数模型,运用小波方法建立了未知系数函数以及模型误差方差的估计量,并讨论了这些估计量的渐近性质。本文还讨论了另一类非参数估计问题,课题来源于复旦—瑞士再保险研究基金和国家自然科学基金项目,我们的研究结果为老年互助保险项目的研究提供了一种切实可行的方法。本课题旨在注重理论和实践相结合,体现学科的交叉与融合。以下是各章的主要内容介绍:本文第一章简略回顾了统计模型的发展与演变,主要介绍了变系数模型的几种不同形式以及相关的各种估计方法,并列出了已有的一些研究成果,同时指出了变系数模型在实践中的可行性与广泛性。同其它方法相比,小波方法有许多优点,比如相对于正交级数估计,它对待估函数的要求较低,而得到的大样本性质较为理想。小波还具有能十分精确地描述出复杂曲线局部特征的能力,因而受到许多工程师、数学及统计工作者的广泛关注。因此本论文的第二、第三章将使用小波估计方法,与此相关在本章简略介绍一些小波的有关知识。在这一章的最后阐述了论文的主要研究内容和结果,并作了小结。本文的第二章讨论如下形式的变系数模型:y=x1β1(t)+…+xpβp(t)+e其中y为响应变量,x=(x1,…,xp)和t为协变量,e为随机误差,且E(e)=0,E(e2)=σ2。{βj(t),j=1,…,p}为未知的非参数函数,不失一般性,假设βj(t)的定义域为[0,1]。σ2是未知参数。该模型可以看作是一般线性模型的推广,它允许回归系数为某一回归变量t的函数,βj(·)能够比较详细地刻画出xj与t的相互关系。另外由于βj(·)为一般的非参数函数,回归模型的偏差显著地减少,有力地避免了“维数祸根”现象。本文假设回归变量x是随机设计,而t是固定设计的情况下,将非参数回归小波的估计方法推广到上述变系数模型,建立了函数系数{βj(t),j=1,…,p}的小波估计并在较弱的条件下得到了估计的强一致收敛性和渐近正态性。本文第三章讨论了上述变系数模型误差方差的估计问题,提出了误差方差σ2的小波估计(?)n2,并证明了它的大样本性质,同时还构造了var(e2)的小波估计(?)n2,证明了(?)n2的弱相合性,并由此得出n1/2((?)n2-σ2)/(?)n(?)N(0,1)。这一结果可用于构造σ2的大样本区间估计或对σ2进行大样本检验。在相同的模型下,与已有的研究结果相比较,我们对待估函数的要求较低,而得到的估计性质较为理想,并且研究的结果可用于统计目的,这是有实际意义的。本文第四章讨论了老年互助保险项目研究中生存函数的估计问题。课题的背景源于保险精算,在老年互助保险中,需要估计健康寿命(能自理)、半自理状态寿命及完全不能自理状态寿命的生存函数,能够知道的信息是只有在60岁以后的各个状态的样本,而要估计的是在60岁以前的某个有限生命区间内各状态的生存函数。其特殊性在于样本取值区间与生存函数的考察区间并不一致,因此通常的经验分布方法并不完全适用。设X1,X2,…,Xn是来自F(x)的独立样本,当F(x)的泛函形式未知,但可用[0,1]上的多项式θ1X±…±θrXr逼近时,郑祖康(1995)已提出一种混合矩估计方法,并建立了估计量的强相合性,只是郑祖康(1995)的方法假定分布函数的支撑集为[0,1],限制了它的应用范围。本文讨论F(x)的泛函形式未知,但经过logit变换后可用多项式逼近的情形,这就去掉了关于支撑集为[0,1]的限制。设F(x)有密度函数f(x),且存在某个r≥1,(r未知),使得logF(x)/(1-F(x))=a0+a1x+…+arxr(?)Jr(x)其中x∈(a,b),(a,b)(?)(a0,b0)。由最小二乘估计的思想,我们得到了逼近多项式的系数{a0,a1,…,ar)的估计,进一步得到了分布函数F(x)的估计量,并且证明了系数估计{(?)0,(?)1,…,(?)r}的一致收敛性和分布函数估计(?)(x)的一致收敛性。我们在主要讨论分布函数F(x)的同时,也得到了其密度函数f(x)和失效函数λ(x)的非参数估计及其相应的大样本结果。模拟结果显示估计是理想的。本文最后作了总结与展望。