论文部分内容阅读
ZI(Zero-Inflated)数据是一类十分重要的数据,它广泛存在于现实生活的各个领域,如医学、制药、生物学等领域。为了分析ZI数据,已有许多文献利用ZI-泊松(ZIP)模型、ZI-负二项(ZINB)模型、半参数ZIP模型进行研究.然而在分析具有偏大离差的ZI数据时ZINB模型要优于ZIP模型。为此,文章结合半参数的思想研究了半参数ZI-负二项回归模型。该模型既含有参数分量,又含有非参数分量,可以更好的解释实际情况。
目前,统计诊断已成为统计分析的重要组成部分,它可以保证统计推断的合理性。文章从全局影响和局部影响两个角度系统地研究了半参数ZI-负二项回归模型的统计诊断问题;并对散度参数的存在性和齐次性两个基本的假设进行了检验。
文章首先介绍了半参数ZI-负二项回归模型;得到了它的惩罚对数似然函数;推导出了参数部分和非参数部分惩罚极大似然估计(MPLEs)的计算公式;并通过随机模拟分别检验了参数部分和非参数部分估计的合理性。随后从全局影响的角度出发,研究了数据删除模型和均值漂移模型;得到了数据删除模型下参数部分惩罚极大似然估计的一阶近似;给出了广义Cook距离,WK统计量,似然距离等诊断统计量;同时得到了它们的一阶近似;并提出了均值漂移模型下异常点检验的Score检验统计量;还证明了数据删除模型和均值漂移模型的等价性。其次研究了ZI-负二项回归模型在微小扰动下的局部影响分析,得到了局部影响分析的曲率计算公式;并对数据的加权扰动和协变量的扰动进行了分析;得到了在MPLEs下计算影响矩阵的简洁公式。接下来文章研究了散度参数存在性和齐次性两个假设检验问题,分别得到了Score检验统计量。另外还通过蒙特卡洛随机模拟说明了文章中所得诊断统计量是有效的。