论文部分内容阅读
背景接受治疗的患者可能包含治愈和未治愈两部分人群,这类数据通常有较高的删失率,在生存曲线尾部表现为平稳的拖尾现象。此类数据用传统的生存分析方法是不合适的,但大量文献显示非统计专业研究者还是会选择传统的Cox比例风险模型或者AFT模型进行分析。目前有关亚组识别的研究有很多,涉及定量、分类与生存等结局指标。但着重点都在于如何识别亚组,而没有关注亚组是否存在的检验方法。据目前所能查到的文献显示,若在试验组的生存时间并未显示出明显改善的情况下,如何检验试验组中是否存在获益亚组尚少见报道。混合治愈模型与评价其预后准确度的K指数可能会为检验生存数据是否存在亚组提供一些理论参考。目的在生存资料存在治愈个体时,分别模拟比较Cox 比例风险模型与比例风险混合治愈模型(Proportional hazard mixture cure model/PHMC model)、AFT模型与加速失效混合治愈模型(Accelerated failure time mixture cure model/AFTMC model)的拟合效果,并通过实例进行对比和验证;基于K指数构建一个统计量用于检验生存资料是否存在亚组,若存在亚组则利用与亚组相关的协变量建立亚组判别模型识别病人的亚组身份。方法采用估计偏差、MSE、置信区间覆盖率与K指数评价Cox 比例风险模型与PHMC模型、AFT模型与AFTMC模型的拟合效果;基于AFT模型与AFTMC模型所得K指数构建统计量Ksub检验生存资料是否存在亚组,当存在亚组时构建统计量Koff寻找区分亚组的最佳时间点,并确定每位患者的亚组身份,进而建立亚组判别模型。结果Cox比例风险模型与PHMC模型的比较:当治愈率为0,即不存在治愈个体时,PHMC模型的估计偏差、MSE、置信区间覆盖率以及KK指数与Cox比例风险模型相近。当存在治愈个体时,PHMC模型的估计偏差的绝对值与MSE始终小于Cox 比例风险模型,置信区间覆盖率始终比Cox比例风险模型更加接近可接受范围,K指数始终大于Cox 比例风险模型。AFT模型与AFTMC模型的比较:当治愈率为0,即不存在治愈个体时,AFTMC模型的估计偏差、MSE、置信区间覆盖率以及K指数与AFT模型相近。当存在治愈个体时,AFTMC模型的估计偏差的绝对值和MSE始终小于AFT模型,置信区间覆盖率始终比AFT模型更接近可接受范围,K指数始终大于AFT模型。Ksub的I类错误基本控制在0.05以内,当删失率逐渐增大时,I类错误有增大的趋势。检验效能在多数情况下能够保持较高水平,但当样本量较少、治愈率低以及删失率较高时,Ksub的检验效能不高。随着治愈率的增加,Ksub的检验效能在逐渐增大。当治愈率固定不变时,随着删失率的增加,Ksub的检验效能在逐渐降低。在用统计量Koff寻找到区分亚组的最佳时间点t(off)之后,在自定义的四种方法中,方法三能够准确和稳定地预测患者的亚组身份,其平均准确度(86.8%)和平均灵敏度(82.5%)最高,并且准确度和灵敏度的波动范围最小(标准差分别为4.1%,5.3%)。虽然其平均特异度低于其余方法,但其本身数值不低(89.7%)且波动范围较小(标准差为6.7%),所以方法三能相对准确地预测患者属于非获益亚组。在与自定义的四种方法相对应的四个判别模型中,模型三能够有效地判别患者的亚组身份,其平均灵敏度最高(93.1%),灵敏度的波动范围最小(标准差为6.7%);平均特异度最高(77.5%),特异度的波动范围最小(标准差为7.2%);平均准确度最高(82.7%),准确度的波动范围最小(标准差为5.1%);平均AUC最大(87.6%),拟合效果最好,并且其AUC的波动范围最小(标准差为3.3%)。结论当生存资料不存在治愈个体时,PHMC模型和AFTMC模型并无明显优势,此时建议采用常用的Cox 比例风险模型或AFT模型进行分析。当存在治愈个体时,建议使用PHMC模型或AFTMC模型进行分析,但需要有足够的样本量。若在试验组相对于对照组疗效并未显示出明显改善的情况下,可用统计量Ksub检验是否存在亚组。若存在亚组,则用统计量Koff寻找区分亚组的最佳时间点T(off),并用方法三识别患者的亚组身份:当受试者的生存时间大于T(off)时,认为该受试者属于获益亚组(Yi=0),能够被治愈,当受试者的生存时间小于等于T(off)并且发生了终点事件(δi=1)时,认为该受试者属于非获益亚组(Yi=1)。当受试者的生存时间小于等于T(off)并且处于删失状态(δi=0)时,如果受试者的P(Yi=0|Xi)大于预测的平均治愈率,则认为属于获益亚组(Yi=0),否则属于非获益亚组(Yi=1)。并在方法三的基础上建立亚组判别模型(即模型三)。