论文部分内容阅读
因果关系一直是生物医学研究的重点。如何在观察性研究和实验性研究中有效地避免混杂偏倚而准确估计因果效应,已成为当今研究中必须解决的关键问题。在观察性研究中,若因果图模型不知或先验信息有限,往往不能准确识别既与暴露因素相关又与结局相关的变量(中介变量、碰撞节点、混杂因素)。假设在不能正确辨识中介变量和混杂因素而采用logistic回归模型分析资料时,若把中介变量误作为混杂因素加以调整,此时会有何种结果?此外,在临床试验中,对于最终临床结局随访时间过长、或患者难以接受有创检测手段、或检测成本昂贵的研究,研究者常用替代终点评价试验结果。通过设计阶段的随机化分组,消除处理因素与结局之间混杂的影响,从而有效避免了众多混杂偏倚。但是,通常难以对替代终点随机化,替代终点与结局之间不可避免存在混杂因素,则会影响因果效应的估计,甚至会产生混杂悖论。为此,本文拟基于因果图模型,通过模拟试验对上述两种情况探索对因果效应的影响。对于前者,应用logistic回归模型误调整中介变量,观察比较暴露对结局因果效应的影响;而对于后者,分别应用工具变量法和logistic回归模型估计替代终点对结局的因果效应值,并加以比较,以期用工具变量法避免混杂悖论。方法1应用logistic回归模型调整中介变量得到暴露对结局的效应估计值,依据因果推断用do-算子(do-caculus)计算其理论值,可得到估计偏倚。分别变动暴露→中介变量的效应值、中介变量→结局的效应值,并观察比较偏倚的变化;通过理论推导,证明调整中介变量后所得偏倚的大小。2基于因果推断,用do-算子分别计算处理因素对结局,以及替代终点对结局的因果效应理论值;分别计算和比较处理因素对结局,以及替代终点对结局的估计值:①用logistic回归模型估计处理因素对结局的效应值;②对不同类别的替代终点,估计其对结局的因果效应值时,所用方法不同:对分类的替代终点,用logistic回归模型和工具变量(Instrumental Variable,Ⅳ)法中的两阶段残差纳入法(TwoStageResidualInclusion,2SRI);对连续型的替代终点,采用logistic回归模型和调整的工具变量(Adjusted Ⅳ)方法。在比较效应估计值与理论值时,需关注替代终点对结局效应值的正负号,以判断有无混杂悖论的存在。结果1因果效应估计中误调整中介变量的后果(1)无论因果图模型中有无混杂因素,logistic回归模型把中介变量误当成混杂因素加以调整,均会导致估计因果效应的偏倚,无混杂因素时,多数情况低估了因果效应值;有混杂因素时,高估了因果效应值。(2)变动暴露→中介变量的效应,或变动中介变量→结局的效应,都会影响总效应的估计,无混杂因素时,前者导致的偏倚更大,对偏倚的影响也更敏感(曲线更陡峭);而有混杂因素时,后者导致的偏倚更大,但前者对偏倚的影响仍更敏感。(3)理论推导证明,把中介变量当做混杂因素调整时,logistic回归模型对效应的估计为有偏估计。2混杂悖论及其因果效应的估计(1)logistic回归模型所得处理因素对结局的效应为无偏估计,并与因果效应理论值的正负号一致。(2)当混杂因素对结局的效应为负值时:无论替代终点的变量类型为分类还是连续型,应用logistic回归模型所得替代终点对结局的效应值均为有偏估计,且估计值与因果效应理论值的正负号相悖;①对分类的替代终点,工具变量法2SRI得到其渐近无偏估计,且与因果效应理论值的正负号一致,无混杂悖论;②对连续型的替代终点,调整的工具变量法所估计的效应值与因果效应理论值大小近似相等,且与因果效应理论值的正负号一致,无混杂悖论。结论1用logistic回归模型估计暴露对结局的总效应时,需正确辨识混杂因素与中介变量,若把中介变量误作混杂因素加以调整,会使效应的估计产生偏倚。2替代终点无论是分类还是连续型变量,当存在未观测的混杂因素时,logistic回归模型可能会产生混杂悖论,运用工具变量法2SRI或调整的工具变量法可避免混杂悖论。