论文部分内容阅读
目的医疗诊断是医生综合患者的症状体征和多种检查信息进行决策和判断的过程,其本质为分类。肝癌是我国最常见的恶性肿瘤之一,早期肝癌患者临床症状和各类检查的特征均不明显,因此难以筛查和诊断。本研究尝试使用机器学习中Logistic回归、加权k近邻、决策树、BP人工神经网络四种分类方法分别构建基于血清学指标的早期肝癌的诊断模型,比较模型的诊断效能,评估四种诊断模型的肝癌筛查价值和辅助临床医生进行早期诊断的可行性。比较四种分类方法的算法特点,探索每种方法在临床数据分析中合适的应用场景。方法选择2010年1月至2018年12月解放军总医院第五医学中心收治的5642例慢性乙型肝炎病毒感染者为研究对象,其中慢性乙型肝炎患者1425例,代偿期肝硬化患者567例,失代偿期肝硬化患者731例,肝癌患者2919例。2919例肝癌患者中符合米兰标准的有808例,定义为早期肝癌患者。本研究只关注早期肝癌,因此研究总样本为3531例。使用分层抽样的方法按照7:3的比例将总样本分为训练集和测试集。训练集中使用Logistic回归、加权k近邻、决策树、BP人工神经网络分别构建早期肝癌的诊断模型,并得到相应模型的最佳参数,然后将构建的模型在测试集中进行验证。受试者工作特征曲线下面积(AUROC)、灵敏度、特异度、准确率等指标用来比较模型在训练集和测试集中早期肝癌的诊断效能。为了更稳健地评价四种分类方法的诊断效能、稳定性、泛化能力,每种分类方法均进行10折交叉检验。结果训练集中Logistic回归、加权k近邻、决策树、BP人工神经网络诊断肝癌的灵敏度分别为48.94%、79.68%、47.53%、69.78%;特异度分别为95.23%、98.95%、97.90%、96.96%;准确率分别为 84.63%、94.54%、86.36%、92.42%;AUROC 分别为 0.721、0.893、0.727、0.834。测试集中 Logistic 回归、加权 k 近邻、决策树、BP人工神经网络诊断肝癌的灵敏度分别为46.69%、38.84%、45.45%、62.40%;特异度分别为 94.61%、90.33%、97.06%、93.88%;准确率分别为 83.66%、78.56%、85.27%、86.69%;AUROC 分别为 0.707、0.646、0.713、0.781。10折交叉检验结果为:训练集中BP人工神经网络模型的错误率的均值和标准差为10.50±0.43,低于决策树的13.34±0.90、加权k近邻的13.52±0.22和Logistic回归的16.28±0.39,差异均有统计学意义。决策树与加权k近邻的AUROC相当(P>0.05)但二者均高于Logistic回归(P<0.05)。测试集中BP人工神经网络模型的错误率均值和标准差为13.74±2.17,低于决策树的15.12± 1.13、加权 k 近邻的 17.57±1.80 和 Logistic 回归的 16.56±0.28,差异均有统计学意义。决策树的AUROC高于加权k近邻和Logistic回归(P<0.05)。加权k近邻和Logistic回归的AUROC相当(P>0.05)。BP人工神经网络、加权k近邻、决策树的AUROC均高于在测试集(P<0.05)。Logistic回归模型的AUROC在训练集和测试集中无差异(P=0.589)。结论BP人工神经网络模型在训练集中表现出最好的肝癌诊断效能,且在测试集中表现最稳定,因此有着很强的临床应用潜能。BP人工神经网络模型算法相对复杂,影响模型拟合的关键参数,即隐含层的节点数量以及泛化能力等指标均需要主观输入,此外BP人工神经网络还有较强的过拟合风险。加权k近邻和决策树模型拟合过程不易受样本量大小以及变量的类型、分布、缺失的影响。加权k近邻无法进行析因分析,决策树有一定的析因能力,决策树中用于对节点进行分类的变量与肝癌有较强的相关性。决策树能输出树形图和分类规则,结果容易被临床医生理解和应用。Logistic回归适用于析因分析,它能够剔除混杂变量并筛选出有限肝癌相关变量,它构建的模型能通过简洁的数学解析式表达便于临床应用,当观测变量太多时,Logistic回归难以解决共线性问题。