论文部分内容阅读
近年来,我国乳腺癌的发病率呈现上升趋势,并严重威胁着女性的健康与生存。诊断和治疗延误在乳腺癌中普遍存在,并可能导致乳腺癌患者出现不良的临床表征及预后。研究乳腺癌的诊疗延误,发现影响延误的主要因素并有针对性的采取措施,对乳腺癌患者的及时就诊与治疗,提高乳腺癌患者的生存率具有重要意义。本文对大连地区298名乳腺癌患者的临床数据进行了分析,以回顾性队列研究为研究手段,基于统计学习方法对乳腺癌诊疗延误的分析及预测方法进行了研究,主要包括以下三方面工作:(1)基于生存分析对患者发生诊疗延误的时间节点进行界定。现有的研究大多完全依靠专家经验来界定延误时间,没有建立合适的统计论证方法。而本研究基于本地临床数据进行生存分析,根据对数秩检验的p值界定延误。然后根据延误分类对生存数据分组绘制Kaplan-Meier生存曲线,并使用Cox模型对所得结果进行进一步验证。(2)基于~2检验、方差分析和逻辑回归分析对患者的延误与其临床表征、社会人口因素进行关联分析,以寻找与发生延误关系最为密切的因素。本文首先对患者的临床表征与延误进行关联分析,以论述延误对患者具体癌症表征的影响,并进一步验证延误定义的合理性;接着寻找影响延误的社会人口因素并根据多重逻辑回归得出独立的影响因素;最后结合本地经济及社会具体情况,对所得结果进行分析并对患者、政府或医疗机构提出减轻延误的建议。(3)基于集成学习建立分类模型用于预测患者的延误倾向。本次研究以患者的临床表征与社会人口因素为因变量,提出了一种基于集成学习的预测算法,该算法以逻辑回归为基学习器,并使用梯度提升法将基学习器进行集成得到强分类器,从而对是否发生延误进行预测。本文通过生存分析界定乳腺癌延误为患者诊疗时间大于1个月的情形,结果具有统计学意义,该结论对大连地区医院的临床治疗具有参考价值;关联分析结果表明患者的延误对其临床表征有显著影响,且患者的夫妻感情、收入水平、首诊医院等级和保健措施情况等社会影响因素与发生延误有较为密切的关系,该结果对患者、医疗机构和政府实施降低乳腺癌延误的措施提供了科学依据;本文还将所提出的模型与常见分类模型与集成学习方法进行比较,结果表明本文算法具有更好的预测效果。