缺失数据下零点膨胀负二项回归模型的统计推断

来源 :昆明理工大学 | 被引量 : 2次 | 上传用户:kaiping56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中,计数数据广泛存在于金融、保险、临床医学、生物遗传学以及抽样调查等多个研究领域中,国内外学者对此类问题进行了广泛的分析研究,建立了各类应用背景下的计数数据模型。在上述模型中,Poisson回归模型是分析研究计数数据的重要模型,也是最基本的模型。Poisson回归模型要求事件的发生相互独立,事件的条件均值等于条件方差,但是,在实际研究分析中,这个前提往往难以得到满足,而负二项回归就是Poisson回归在这一情况下的一种扩展。在实际的计数数据的分析研究中,常由于各种原因导致观测数据中存在大量的零,当其比例远远超过Poisson回归或负二项回归的预测能力时,表现出零点膨胀现象(zero-inflated)。经典的零点膨胀计数数据模型,通过对零计数和非零计数建立混合回归模型,很好地解决数据中存在的过多零的问题。本文在Greene(1994)提出的零膨胀负二项回归模型(zero-inflated negative binomial, ZINB)的基础上,系统的讨论了计数数据建模的基本思想,单水平ZINB模型,双水平带随机效应的ZINB模型,以及缺失数据下的ZINB模型。现将本文的主要研究内容概述如下:(1)分析讨论了刻画计数数据的常用分布,对其数字特征,应用范围做了系统的介绍,并且详细介绍了计数数据建模的基本思想,尤其是对存在零点膨胀的计数数据的建模方法。(2)在完全数据模式下,针对不同的情况,分别讨论了单水平ZINB模型,以及双水平带随机效应的ZINB模型,并分别给出了针对零点膨胀的Score检验统计量以及相应的抽样分布和势。(3)基于Little和Rubin于2002年提出的缺失数据模式和缺失机制,我们分析研究了缺失数据下的ZINB模型,建立起了模型参数的ML估计程序以及模型选择标准,并在论文的最后给出了模拟研究。综上所述,针对存在零点膨胀以及缺失数据的计数数据,本文主要在ZINB模型的基础上,给出了完全数据下的ZINB模型以及相应的Score检验统计量,缺失数据下的ZINB模型的参数估计及模型选择标准,并给出了相应的模拟研究。
其他文献
看了《绝命后卫师》后,非常激动,也很欣慰!《绝命后卫师》主要描写红军长征过程中红三十四师的英勇事迹,刻画的是红三十四师6000名闽西子弟兵的英勇形象。它还原了长征史上一
随着人类社会的不断发展,对能源的需求与绿色发展理念之间的矛盾日益激烈,目前,全球将近60%的能源由化石能源燃烧所产生的的热能转化而来,其利用效率只有40%,其余的能量无法得到有效的收集和利用,如果发展一项新技术与产品,能有效收集并利用这部分能量,这可能对日益严重的能源危机和环境保护作出很大的贡献。热电材料就是一类能实现热能与电能之间互相转换的能源材料。目前,应用较为成熟的热电材料是Bi-Te基二元
关于管理层收购问题一直是一个热议的话题。目前国家层面对中小企业管理层持股是持一种肯定态度,但其中有些问题需要规范。对管理层收购而言会通过提高企业经营效率增加收益,
目的评价甲状腺抗体检测在甲状腺功能诊断中的价值。方法随机抽取2014年12月~2017年3月150例患有甲状腺疾病患者,分为甲亢组(n=75)与甲减组(n=75),观察两组患者的甲状腺球蛋
前言 颅脑外伤后有脑脊液(Cerebrospinal fluid,CSF)自鼻孔或耳道流出,构成脑脊液鼻漏或耳漏,统称为脑脊液漏(CSF漏)。CSF漏是颅脑外伤后常见的并发症,其发生率介于2-9%之间。
晋江天然气发电有限公司(以下简称:晋江气电)成立于2004年9月,是以天然气发电为主,兼具光伏发电、风力发电的一家绿色发电企业。晋江气电一期工程装机容量为1400 MW,每年发电量
油茶是我国所特有的重要木本油料树种,具有很高的利用价值和经济价值。近年来,我国湖南、江西、广西等主要产区油茶炭疽病发生普遍,严重影响了油茶产量和品质。目前,炭疽病菌
新工艺白酒 特定时代催生的产物$$   新工艺白酒确切应称为“固液法白酒”,根据国标GB/T20822-2007 固液法白酒,其定义是:以固态法白酒(不低于30%)与液态法白酒勾调而成的
报纸
浆膜腔积液是尿毒症患者较为常见的并发症,可使患者全身状况恶化,极大的影响患者生存质量,甚至导致死亡。尿毒症患者并发浆膜腔积液的原因多样,还有一些原因尚未明了,但如果
目的 探讨急性期抑郁症患者的抑郁与患者防御方式之间的关系。方法 采用明尼苏达多项人格调查表MMPI和防御方式问卷DSQ分别对60余名急性期抑郁症患者进行测查。结果 以抑郁分