论文部分内容阅读
线性模型是一种研究变量间关系的统计模型,广泛地应用于生物、医学、管理、经济等领域.由于因变量有可能是离散的,因而需要将线性模型推至广义线性模型.在实际问题中,如果只对总体数据进行分析,得到的结论往往会出现偏差.针对这类问题,需要对异质总体同时建模.在异质总体中,混合回归模型是一种重要的分析工具.另外,为了能更好地了解异质总体的方差来源和有效地控制方差,同时对方差建模很有必要.在经典的广义线性模型中,响应变量之间可能存在相关性,可能会出现所谓的"超散布性".其分布不再是指数族分布的标准形式,那么用极大似然方法估计参数就不再适用,由此发展了拟似然估计方法.在拟似然估计方法中只需要假定总体的前一、二阶矩存在.本文结构如下:首先,根据不同的统计特性将总体分为两类或两类以上,仅对均值建立模型,得到混合广义线性模型;利用EM算法得到参数的伪似然估计和扩展拟似然估计,再通过Monte Carlo模拟验证模型的有效性,并通过实例数据验证了其实用性和可行性.其次,针对异质总体异方差数据,对均值建模的同时也对散度建模,得到混合双重广义线性模型;然后,采用EM算法进行参数估计;再通过Monte Carlo模拟并结合实例数据检验模型的有效性和实用性.最后,利用惩罚似然函数方法,对混合双重广义线性模型做变量选择.根据三种不同的惩罚函数得到对应的惩罚似然函数,利用BIC准则选择均值模型与方差模型的调整参数;再运用迭代算法得到变量选择的具体计算过程;进一步通过模拟试验验证所提出的变量选择方法是科学的.