流行病学数量参数—病死率和再生数的估计方法研究及应用

来源 :南方医科大学 | 被引量 : 1次 | 上传用户:kuxinghuajia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第一章疫情发展中病死率估计方法的研究及应用背景近几十年来,接二连三爆发的一系列传染病给灾区人民以及世界政府带来了不可磨灭的灾难。例如1957年的流感、1976年刚果的埃博拉病毒、2002~2003年的SARS病毒、2013年的H7N9、2014年西非的埃博拉病毒等等。所有这些爆发的疫情无论对社会还是对经济都造成了巨大的影响。这些提及的疫情已经成为了过去,更重要的是新发疾病依旧会对社会和公共卫生造成巨大的危害。当新发疾病爆发时该如何应对这一疫情,来降低它对社会、公共卫生以及经济的影响?每当新发疾病在人群中爆发时,最先关注的一方面就是该疾病是否严重,人群中的致死率多大。众所周知,疾病的严重性可以使用病死率(case fatality risk, CFR)来衡量,病死率定义为在给定时间内因该疾病死亡人数占该疾病确诊人数之比。病死率可以被用来预测该疫情的潜在死亡人数以此来反映公共卫生制定的医学措施是否合适以及医疗质量如何。美国CDC (Centers for Disease Control)使用病死率来帮助制定PSI指标(Pandemic Severity Index),该指标被使用来制定详细的公共卫生策略。综上所述,当新发疾病爆发时,准确的估计病死率显得尤为重要。然而疫情中删失数据的存在是个很严重的问题,应该十分的重视并且要解决这个问题,因此许多学者构建了相应的统计模型来解决这一问题,并且Chen-Nakamura将影响因素纳入到模型中求解病死率。可是对于在不含协变量的估计病死率的众多方法中,在何种情况下何种病死率估计方法较优并没有做一个系统的比较。在新发疾病爆发来临时,为了能更好的估计病死率值,各个方法之间的比较显得尤为重要。目的在疫情发展过程中(删失数据存在情况下),通过Monte Carlo模拟,比较病死率估计方法的估计性能,为新发疫情到来时提供一种较为精确的病死率估计方法。方法采用Monte Carlo模拟疫情两种情形,情形Ⅰ:病死率在整个疫情过程中恒定不变,设为0.2;情形Ⅱ:病死率在整个疫情中逐渐下降,病死率最初(也就是第0天)设为0.8,之后病死率每天下降0.01(0.01/day),表达式为CFR(t)= (0.8-0.01t)Ⅰ(t≤ 80),其中I(x)是指示函数,若x为真则该函数值为1,否则为0。两种情形下患者发病时间均使用gamma分布产生,均数(mean)和标准差(sd, standard deviations)分别为65天和31天。患者最终的生存状态(死亡或者治愈)由均匀分布产生,首先产生一个服从0-1上长度等于样本量的均匀分布,若均匀分布数值大于0.2(或情形Ⅱ下时间点对应的病死率值)则对应的个体结局事件为治愈:否则,该个体发生死亡的结局事件。发病到死亡和治愈的生存时间均使用gamma分布。发病到治愈的生存时间分布均数设置为10、15和20天三种情形,发病到死亡的生存时间分布均数设为15天,同时两个结局事件生存时间分布标准差均设为10天。评价指标:对应时间点的真实病死率值(observed timely CFR)定义法求解病死率值(crude method, crude)对应方法的估计值95%可信区间(95% confidence interval,95%CI)经验方差(empirical variance, Var.)估计值方差的均值(Mvar)偏移(bias,估计值与真实值之差)均方误差(squared bias plus the empirical variance, MSE)结果情形Ⅰ时,也就是病死率整个疫情中恒定设为0.2时。显而易见,定义法(Crude)全程低估了实际病死率真实值(Observed) 。在汇总型病死率估计方法中,MD2方法能在早期较为准确的估计病死率值,因为该种方法是基于疫情初期提出来的。但是当疫情逐渐发展时,MD2的MSE变得越来越大并且点估计很大程度的偏离真实病死率值,该种情况表明MD2方法在疫情中期以及后期不合适。方法MD1估计值在疫情前期和中期明显低估了病死率真实值,即使到了疫情末期也会稍微低估病死率真实值。MD3、MD4、MD5和MD6方法估计准确性随着疫情的发展而越来越接近真实值,估计值、bias和MSE逐渐减小。在这四种方法中,MD5和MD6估计值的精确性在疫情的中期和后期相对较好。但是在疫情初期时,MD3和MD4能较好的估计病死率。然而MD5和MD6方法估计病死率的准确性还受到发病到治愈的生存时间均数变化的影响(当发病到死亡的生存时间均数固定时)。当发病到治愈的生存时间均数小于发病到死亡的生存时间均数,MD5和MD6会低估病死率值。相反,则会高估病死率值。当二者相等时,MD5和MD6即使在疫情初期也能较好的估计病死率。值得注意的是,这种效应在疫情后期并没有明显的效果。在个体型数据病死率估计方法中,疫情初期也就是删失率很大时(比如疫情第20天),所有的估计方法偏移都较大。但是当疫情慢慢发展时换句话说就是删失率越来越小,病死率估计值越来越接近真实值。MO7方法估计值在疫情初期低估病死率。综合各种指标(点估计、95CI和MSE)MO8方法的估计值在疫情初期稍微的较MO9方法好一点。MI10方法的估计值在疫情中期和后期不太理想。当发病到死亡的生存时间均数固定时,发病到治愈的生存时间均数对MO8的影响和MD5、MD6一致。情形Ⅱ时,定义法(crude)估计病死率直到疫情末(比如疫情第80天和100天)才能较好的估计病死率值。在该情形下,基于个体型数据的病死率估计方法在初期(比如疫情第20天和第40天)表现很差。但是随着疫情发展,个体型数据病死率估计方法也越来越精确,95%可信区间宽度也越来越小。虽然如此,到疫情末期病死率还是略微高估病死率真实值。在汇总型数据病死率估计方法中,MD2方法的估计值在疫情初期和情形Ⅰ一样能较好的估计病死率值,但是到了末期,无论是偏移还是MSE都随着疫情发展越来越大并且点估计也很大程度偏离真实值。MD1方法在整个疫情中波动较大,开始低估,随着疫情发展慢慢的靠近病死率真实值,然而到了后期出现高估现象。剩下的估计方法中除了MD6都随着疫情的发展越来越接近病死率真实值。其中MD5方法估计效果最佳。MD6方法的估计值在情形Ⅱ下能反映出病死率在整个疫情中的变化情况,病死率在疫情整个过程中逐渐下降。由于病死率在整个过程中都是变动的,没有一个相对较好的指标来判断发病到死亡和治愈的生存时间均数对病死率估计的影响。即使这样,MD5方法的估计值受它的影响在疫情初期还是很明显的。结论基于个体型数据病死率估计方法比基于汇总型数据病死率估计方法较好:基于个体型数据病死率估计方法中MI8法较好,若无法收集到个体型数据只收集到了汇总型数据,使用MD5和MD4来进行病死率估计也是不错的选择。若研究人员想知道病死率在整个疫情中的变化情况,可以考虑使用MD6方法进行病死率估计。值得注意的是,Ghani指出在疫情初期进行病死率估计时使用区间段来衡量初期病死率比使用点估计恰当,所以在初期时给出病死率的一个参考区间更为合理。第二章再生数估计方法的研究及应用第一节考虑到隐性感染人群的潜伏期和发病期均传染的SLICAR模型背景当疫情爆发过程中仅仅只是拿衡量疫情严重程度的指标—病死率来制定决策是远不够的;应当结合疫情传播速度的指标—基本再生数一起对疫情进行整体评估,从而制定更完美的策略。基本再生数(Basic Reproduction number, R0)定义为一个病人在其具有传染性的期限内预期直接传播的新病例数,亦即直接传播的第二代病例数。基本再生数临界值为1,当小于1时疾病会自然消亡;若大于等于1,疾病在无干预的情况下会一直蔓延,数值越大,传播速度越快。对于流行病传播情况的研究,Kermack、Aron、Schwartz等人对常见的流行病学模型进行了深入的研究;然而Aaron指出具有传染性的隐性感染者对疾病的传播不可忽视。隐性感染(Asymptomatic or Inapparent Infection)是指病原体侵入人体后,仅引起机体产生特异性的免疫应答,不引起或只引起轻微的组织损伤,因而在临床上不显出任何症状、体征,甚至生化改变,只能通过免疫学检查才能发现。Yang等研究指出,对于像甲流等此类流行病,存在隐性感染并且该类人群具有一定的传染能力。当该类人群所占比重较大时,其对疾病的传播会产生不容忽视的作用,如Longini在研究中假定隐形传染者占到33%。而对于用以反映流行病传播能力的重要参数——基本再生数R0的估计,现有的研究所建立的动力学模型中均未同时考虑到具有传染的隐性感染和潜伏期对R0估算结果的影响。目的提出一种包含隐性感染者并且含潜伏期均传染的流行病模型。方法基于已有的SEIR模型,加入隐性感染者分箱得到SLICAR (Susceptible-Latent-Infected-Confirmed-Asymptomatic-Recovered)模型,运用最小二乘思想拟合模型参数。并以2009年春季的甲型H1N1和1918年秋季的Spanish流感数据为实例分析并验证模型。结果SLICAR模型能较好的拟合H1N1和Spanish疫情,H1N1流感数据模型拟合的基本繁殖数Ro值为2.174(决定系数R2=0.802)以及Spanish数据疫情17天拟合Ro值为2.636和疫情结束时拟合值为3.675。结论SLICAR模型考虑到了隐性感染者以及潜伏期患者的传染性,为基本繁殖数R0的估计提供了一种较为全面的算法;也为疫情防控提供了更为全面的信息。第二节SEIRD模型的构建以及埃博拉疫情再生数的全面分析背景在常见的SEIR类型的模型中使用固定的病死率值来进行估计基本再生数是不合适的,因为在整个疫情中病死率大部分都是变化的。因此,本处在常见的SEIR模型中引入每日变化的病死率值,构建SEIRD模型(susceptible-exposed-infectious-recovered-dead).并将新构建的模型应用到埃博拉疫情中去(1976年刚果埃博拉、1995年刚果埃博拉和2014年西非两个国家的埃博拉疫情)。同时,在对这些疫情求解基本再生数时,还估计了对应疫情的时间相依再生数(Timely Reproduction Number, Rt),对疫情中干预措施进行评估,更加全面的认识疾病的发展过程。目的提出一种纳入了时间相依病死率的流行病学模型,并对埃博拉疫情传播情况进行全面分析。方法构建SEIRD模型并应用到埃博拉疫情中求解基本再生数,同时使用时间相依再生数对埃博拉疫情进行分析。结果SEIRD模型能较好的拟合埃博拉疫情,使用不同的病死率估计方法,对R0的结果影响不大。其中,MD3和MD4法结果基本一致。埃博拉疫情Ro估计值随着年份的增长而变小,其中2014年塞拉利昂和几内亚两个国家都均小于前面的年份,接下来详细介绍下各个年代疫情的基本情况。1976年刚果的埃博拉疫情截止到9月22日算得R0值为3.909,到9月19日(Rt=1)时R0为4.146。Rt值随着疫情的发展而降低。在9月19日之后Rt值一直处于1以下:说明疫情得到初步控制。1995埃博拉疫情截止到1995年4月28日时,R0值为1.887;到5月21日(Rt=1)是1.853。时间相依值Rt和1976年的大体趋势一致,都是随着疫情的推移而慢慢的下降。从5月21日开始,Rt值一直小于1,说明疫情得到初步控制,干预措施取得成效。2014年埃博拉疫情截至到12月31日,塞拉利昂和几内亚R0值分别为1.409和1.251。当疫情截止到Rt=1的时间点时(塞拉利昂和几内亚分别为:11月8日和12月16日),R0值分别为1.502和1.261。塞拉利昂Rt值处于下降趋势,在11月8号Rt值小于1,之后一直处在1以下。几内亚前期(八月之前)Rt值波动较大,但在1附近,之后Rt值逐渐下降,12月16号之后Rt值小于1。结论基本再生数R0和时间相依再生数Rt两者结起来能更为全面分析疫情的传播情况,并能对疫情中干预措施有效性进行评估。
其他文献
牵张成骨技术作为一项新技术在口腔颌面外科的治疗仅有10多年的时间,具有独到的优点。近些年来,伴随相关研究的发展,牵张成骨技术的应用更加深入。本文将就牵张成骨技术在口
发酵调控的研究必须以准确的生物量测定为前提.在Monascus-3液体发酵中考察干菌DNA含量和生物量(菌体干重)的关系,结果表明:干菌DNA含量与菌体干重的变化趋势一致,且DNA量约
【正】 一、目前,现代主义的界定混乱不堪提起西方的启蒙主义,我们说它是个文学思潮;原苏联的社会主义现实主义,我们说它是创作方法;法国的湖畔派,我们说它是个文学流派;每一
目的:探究微针导入氟尿嘧啶在增生性瘢痕防治中的应用效果。方法:选取2017年1月1日-2017年12月31日笔者科室收治的增生性瘢痕患者30例,按随机数字表法将其分为对照组(n=15)和
目的:了解赣州地区恙虫病患者的临床特征及其病原体恙虫病东方体(orientia tsutsugamushi,OT)的基因类型。方法:1、收集2012至2015年赣南医学院第一附属医院(赣医一附院)收治
介绍了铁路车站动态轨道衡使用现状,分析问题产生的原因,并提出了具体的建议措施供有关管理部门决策参考。
近年来,多盐多脂的饮食方式给人们的健康带来了危害,低脂和无脂食品应运而生,得到了广大学者的深度研究和探讨。通过对近年来国内外对不同来源的脂肪替代品,如:碳水化合物类脂肪模
结合地质水文资料、施工技术水平、工程造价、工程工期、同类工程施工经验等方面综合比较,采用更加合理的计算模型及公式,根据不透水层起伏情况合理分段、优化参数等方式对降