论文部分内容阅读
根据世界卫生组织统计数据显示,肺癌的发病率、死亡率长期位居各种恶性肿瘤之首,全球每年约有135万人死于肺癌,肺癌患者的5年生存率仅有15%~30%。英国麦美伦癌症援助中心的数据显示医学的发展并未显著增加肺癌患者的生存时间,只是从1971年的8周上升到2011年的20周。近年来,广大医疗工作者和科研人员开始关注肿瘤进展的建模研究,此项研究能辅助医生了解临床治疗方式和患者临床症状对肿瘤进展的影响,具有重要的科研和临床意义。本文以非小细胞肺癌患者为研究对象,以预测非小细胞肺癌患者肿瘤进展为主要研究目标,以解决Cox模型中时间相依协变量问题、变量选择问题为研究切入点,研究利用Cox模型预测肺癌患者肿瘤进展的建模方法。本文的主要研究内容如下:(1)针对临床医学纵向数据中经常出现的时间相依协变量,提出基于临床检测指标变化特征的时间相依协变量Cox模型建模方法。根据患者的临床检测指标变化特点反映时间相依协变量随时间变化的函数形式,既避免了估计这类协变量随时间变化形式的难度又利用了纵向数据中协变量的变化信息。并且,利用C-Index指数和校准图对Cox模型的预测准确率做出验证。(2)研究基于自适应惩罚函数的变量选择方法,利用此方法建立变系数模型,并利用仿真数据对此方法进行验证。仿真数据验证了此方法可以很好的识别模型中的变系数、常系数和零系数,变量选择的结果具有Oracle性,并且模型的估计结果比目前存在的研究方法更稳定。此外,利用此方法识别肺癌患者的检查指标对肿瘤大小的影响效应类型,分析出哪些检查指标对肿瘤大小的影响为时变效应,哪些检查指标对肿瘤大小的影响为恒定效应,哪些检查指标对肿瘤大小的影响为零效应。(3)利用基于自适应惩罚函数的变量选择方法建立Cox模型,避免经典变量选择方法在协变量个数较多时容易造成累计误差和过拟合的不足。本文结合生存时间资料的特点对自适应惩罚法在Cox模型中的应用进行改进,使自适应惩罚法能够更加适用于实际应用中的生存时间资料。仿真实验结果证明了改进后的自适应惩罚法进行Cox模型变量选择时仍具有Oracle性且系数估计具有稳定性。并且,将此方法应用到非小细胞肺癌患者的生存时间资料中,建立的Cox模型的预测准确度比传统变量选择方法建立的Cox模型的预测准确度提高了9.8%。