论文部分内容阅读
混合回归模型是一种常用的统计建模工具,现已被广泛应用于生物学、医药学、遗传学、物理学、经济学和金融学等各个领域.然而,随着信息技术的发展,各种数据之间的关系变得越来越复杂,单纯的参数混合回归模型已经无法满足理论和实际应用的需求.基于此,本文主要致力于将传统的参数混合回归模型推广至半参数混合回归模型的研究.具体地,本文主要做了以下几个方面的工作: 首先,本文提出了函数型混合回归模型.该模型考虑了数据总体的异质性和个体不同时期之间的相关性,与单纯的截面混合回归模型和函数型回归模型相比,该模型具有更强的数据适应性.本文证明了函数型混合回归模型的可识别性并给出了模型估计的算法.另外,本文还应用了一种基于条件bootstrap方法的广义似然比检验来验证回归系数是否为常数.进一步,本文利用数值模拟研究了所提模型的有限样本性质.通过对实际问题CO2-GDP数据的建模分析,发现人均GDP对人均CO2排放量的影响在不同国家之间具有差异性. 其次,本文系统地研究了一类混合比例依赖于协变量的半参数混合广义线性模型.该模型推广了Huang and Yao(2012)的研究成果.针对该模型,本文采用了一种基于EM算法和局部似然估计的后向拟合算法来估计模型参数,并证明了所得估计量具有渐近正态性.另外,本文还利用了bootstrap方法来检验混合比例是否依赖于某个协变量.数值模拟和实例分析结果显示,在有限样本的情况下,本文所提的模型和方法具有很好的表现. 再次,本文提出了混合部分线性模型.该模型假设每一个混合成分均为一个部分线性模型.由于该模型允许响应变量与某些协变量为线性关系,与另外一些协变量为非线性关系,同时又考虑了数据总体之间的异质性,因此,混合部分线性模型能够更加灵活地刻画数据之间的结构关系.本文发展了一种PL-EM的算法用于估计混合部分线性模型,并证明了所得估计量的渐近正态性和PL-EM算法的逐步上升性质.进一步,本文利用假设检验的方法验证了模型的非参数部分是否具有线性结构.此外,本文还使用数值模拟和实际数据对所提模型和方法进行了验证. 本文研究的三个半参数混合回归模型各具特色,它们可以分别用于解决具有不同异质性数据结构的实际问题.本文研究内容的创新之处主要体现在以下三个方面:模型的创新,估计方法的创新以及实际应用的创新.这些成果不仅在理论上很有意义,而且具有非常广泛的应用价值.正如将参数回归模型推广到半参数回归模型那样,它们不但丰富了现有混合模型的研究成果,同时也为解决更加复杂的实际问题提供了不同的思路和方法.