基于零膨胀计数数据回归模型的贝叶斯分析

来源 :昆明理工大学 | 被引量 : 5次 | 上传用户:bolen9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计数数据广泛的存在于生物医学、金融保险、公共健康以及风险控制等领域,零点膨胀是该数据所呈现出的特征之一。所谓零点膨胀,即零观测的比例远超过了拟合分布所允许的范围,也即在零处发生了膨胀。零点膨胀泊松回归模型是拟合上述数据的一般选择。此外,计数数据还常常会呈现出散度偏大的特征,若数据方差的变化大于其均值,则称该数据是散度偏大的。较传统的零点膨胀泊松回归模型而言,零点膨胀下的负二项(ZINB)回归模型更能够解释数据中散度偏大的结构,是分析散度偏大计数数据的有力工具。从已有的研究成果来看,现有的方法和理论大都集中于计数数据的似然分析方面,相比之下,对于现实生活中广泛存在的计数数据的贝叶斯分析仍存在较大的研究空间,特别是对散度偏大计数数据下的层次回归模型的贝叶斯统计推断研究仍有待进一步完善。与极大似然方法相比,贝叶斯方法综合了样本中的先验信息,对于某些分布的建模又具有较灵活的特点,特别是对于缺失数据与复杂模型的研究,贝叶斯方法尤其具有计算的可行性、有效性等方面的优势。因此,本论文将从贝叶斯分析的角度入手,对具有零点膨胀和散度偏大的计数数据进行深入研究。论文首先针对计数数据的零膨胀问题,建立与Probit模型相结合的零膨胀泊松回归模型,同时建立起了结合Gibbs抽样与M-H算法的MCMC技术以获得模型参数的贝叶斯估计,在此基础上,论文采用了DIC信息准则以进行模型之间的比较和选择并进一步考虑了偏后验预测p值以合理评估模型的拟合优度。此外,由于抽样程序及问卷设计的需要,计数数据往往会呈现出组内相关与组间独立的特征,经典的纵向计数数据分析理论总是对随机效应及随机误差均考虑正态分布的情形,然而在实际应用中,这样的假设缺乏统计上的稳健性与建模的灵活性,特别是对于具有尖峰厚尾以及非对称的“非正态型”数据而言,这样的假设会导致有偏甚至无效的统计推断结论。为此,本论文重点考虑了偏斜正态分析下的ZINB层次回归模型的贝叶斯分析问题。具体的,建立起了关于零点膨胀计数数据的ZINB层次回归模型并对随机误差及随机效应考虑偏斜正态分布,在贝叶斯后验推断方面,基于数据添加思想及偏斜正态分布的随机表示理论,建立起了三层次的贝叶斯分析模型并最终得到模型的后验分布。实际例子表明,该论文提出的方法是有效的。
其他文献
与Gamm a函数相关的一些特殊函数(特指Psi函数和digamma函数)的完全单调性已经广泛的应用于数学的各个分支,例如在组合数学、数值与渐近分析、物理学、位势理论和概率统计等
极端嗜热菌微生物Caldicellulosiruptor kronotskyensis 2002可以将纤维素转化为氢和其他化学物质,并且能够直接利用含木聚糖的天然生物质。该菌中有多种多功能结构域木聚糖
本文以荒漠沙生植物盐爪爪(kalidium foliatum)和盐节木(Halocnemum strobilaceum)为研究对象,采用盆栽模拟试验,用1M的NaOH溶液和HCL溶液调配Hoagland营养液,模拟pH值为6、7
能源危机和温室效应等环境问题已经越来越多地引起国际社会的关注,人们对利用可再生的非粮食来源的原料制备生物燃料的研究也更加关注。与传统生物燃料乙醇相比,丁醇因为其高
本文主要是在次线性期望空间(Ω,H,E)中讨论由G—布朗运动驱动的随机泛函微分方程。首先,在随机泛函微分方程系数满足线性增长和局部Lipschitz条件下,证明了的解的存在性和唯
ε-聚赖氨酸(ε-poly-L-lysine,ε-PL)是一种由赖氨酸单体中的α-羧基和ε-氨基连接而成的微生物次级代谢产物,可抑制多种微生物的生长,在食品、医药等领域具有潜在的应用价
刺激响应型囊泡由于在模拟细胞膜的选择性和构造智能材料方面的潜在应用而受到广泛关注,其中研究最多的是聚合物囊泡。但是合成聚合物的过程复杂且往往涉及有机溶剂,导致聚合
工程中的结构件常受到交变载荷的作用,在服役的过程中会产生疲劳裂纹,裂纹的存在对实际生产和生活造成了严重的危害,甚至是灾难性的后果。利用电磁场的热效应对含裂纹缺陷的
随着天文观测技术的不断进步,越来越多的观测数据表明:宇宙的膨胀不但没有在万有引力的作用下减速,反而在“暗能量”的作用下变得越来越快。另一方面,全息原理被广泛认为是量
真核生物广泛存在的转录延伸因子y ELF1(elongation factor 1)是一类进化保守、结构相似的DNA结合蛋白,与减数分裂染色体及基因转录延伸有关。但目前还不清楚y ELF1在基因转