论文部分内容阅读
事件数(event count)是指单位时间、空间内事件发生次数,变量取值为0,1,2,3,…等非负整数,表现为事件发生次数的离散型随机变量。Poisson回归是计数资料(count data)统计分析的首选模型,也是实际应用中计数资料分析的基本模型。Poisson回归要求事件的发生相互独立,事件的条件均值等于条件方差,这一假设在实际应用常常显得过于严格。负二项回归就是Poisson回归在不同情况下的一种扩展。在计数资料中常存在大量的零计数,当零的比例远超过Poisson回归或负二项回归的预测能力时,表现零膨胀现象(zero-inflated)。零膨胀Poisson模型通过对零计数和非零计数建立混合回归模型,能很好地解决数据中存在的过多零的问题,本文还将ZIP模型扩展到了零膨胀负二项回归模型。本课题针对计数资料过度离散的检验,零膨胀模型构建,基础模型与零膨胀模型的模拟研究,不同模型选择以及实例对比分析等方面展开探讨。其主要结果如下:1.计数资料分析中计数模型有相对经典模型的优势与对计数资料分析误用有序logistic回归或多重线性回归相比,计数模型更加符合计数资料的本质特征。2.过度离散时的模型选择过度离散时,可将Poisson回归作为探索性分析方法,选择负二项回归更合适。3.零膨胀计数模型的BHHH估计在大多数情况下,零膨胀计数模型方差的BHHH估计量比Hessian矩阵简单,但是两个估计量都是渐近等价的,在有限样本中可能给出不同的统计分析结果,本文的第一个实例证实了这一点。4.计数资料模型选择的Vuong检验在非嵌套计数模型选择中Vuong检验有足够高的检验效能,但模拟研究也表明Vuong检验似乎更倾向于复杂的模型。5.ZIM参数的Bootstrap估计ZIM参数的Bootstrap估计结果显示,在实际应用中并不能保证ZIM的极大似然一定收敛于全局最大值处,这可根据Bootstrap估计的结果评价单次ZIM极大似然估计值的稳定性和一致性。