论文部分内容阅读
目的:肺癌是世界上最常见的恶性肿瘤之一,发病率和死亡率居高不下。肺癌的发生与肺结节密切相关。肺结节指肺内直径小于等于3cm的类圆形病灶,分为良性和恶性。其中,恶性结节约占肺结节的30%,一般需要通过穿刺或手术的病理结果最终被确诊为肺癌。在临床工作中,如何从肺结节中准确地筛选出早期肺癌是对医生最严峻的挑战。通过构建一种更准确、可行、有效的预警模型区分早期肺癌与良性结节患者,将为解决这一问题提供强有力的手段。Nomogram是一种新型统计学描述工具,近年来,广泛应用于肿瘤诊断、远处转移和预后评估等领域。它建立在多因素回归分析的基础上,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系。代谢组学可以检测机体的小分子代谢物,与疾病,尤其是肿瘤的相关性研究得到了广泛关注。既往研究提示氨基酸和肉碱在肿瘤发生发展中均发挥重要的作用。因此,本研究旨在构建基于靶向代谢谱的早期肺癌预警Nomogram模型,通过该模型医生可以评估肺结节的良恶性,预测早期肺癌的发生风险,从而最大限度地提高患者的获益。方法:本研究为回顾性研究,共纳入848例患者,将其随机以7:3分为训练集和验证集,分别为594例和254例。训练集包括260例肺良性结节患者和334例早期肺癌患者,验证集包括110例肺良性结节患者和144例早期肺癌患者。所有患者的组织标本均经手术获得。肺组织经大连医科大学附属第二医院病理科医师明确诊断。收集患者的性别、年龄、20种氨基酸和27个肉碱临床资料。比较早期肺癌组和肺良性结节组的临床指标,选取差异有统计学意义的变量进一步进行LASSO回归,采用R软件的“glmnet”数据包。通过LASSO回归筛选变量,进一步建立logistic回归模型。通过R软件的“rms”数据包,在回归模型系数基础上建立Nomogram。通过绘制ROC曲线,计算AUC和95%CI评估模型的区分度。进一步绘制校准曲线,用于评估预测模型的一致性,使用1000次bootstrap重抽样。再通过决策曲线分析进行评估Nomogram在临床使用中的获益程度。此外,将数据带入既往研究报道的Ni等人构建的肺癌诊断模型,比较本研究模型与Ni等人构建模型的AUC值。本研究采用SPSS 23.0和R 4.0.3软件进行统计学分析,P<0.05具有统计学意义。结果:(一)患者临床指标分析通过比较训练集中334名早期肺癌患者与260名肺良性结节患者的临床指标,发现一共有30个变量组间差异有统计学意义(P<0.05),分别是年龄、性别、Orn、Thr、Asp、Tyr、Cit、Glu、Val、Pro、Ser、Asn、Trp、Gln、Met、Arg、C4OH、C4DC、C5DC、C5OH、C5:1、C6DC、C8、C12、C14、C14:1、C16、C22、C24、C26。(二)LASSO回归筛选预测变量将有意义的变量进行LASSO回归,选取=0.005612时,共筛选出25个变量,分别为:年龄、性别、Orn、Thr、Tyr、Glu、Val、Pro、Ser、Asn、Gln、Met、Arg、C4OH、C4DC、C5DC、C5OH、C5:1、C8、C12、C14:1、C16、C22、C24、C26。(三)构建Nomogram对入选的25个变量进行多因素Logistic回归,发现13个早期肺癌发生的独立预测因素,分别为年龄(OR:1.065,95%CI:1.043-1.087,P<0.001)、性别(OR:2.274,95%CI:1.405-3.680,P=0.001)、Orn(OR:0.952,95%CI:0.926-0.980,P=0.001)、Tyr(OR:1.025,95%CI:1.007-1.044,P=0.008)、Glu(OR:1.010,95%CI:1.003-1.017,P=0.003)、Val(OR:1.015,95%CI:1.006-1.024,P=0.001)、Ser(OR:0.948,95%CI:0.930-0.967,P<0.001)、Asn(OR:0.977,95%CI:0.962-0.992,P=0.003)、Arg(OR:1.098,95%CI:1.037-1.162,P=0.001)、C4DC(OR:0.055,95%CI:0.014-0.218,P<0.001)、C14:1(OR:2.890,95%CI:1.621-5.153,P<0.001)、C5OH(OR:1.386,95%CI:1.023-1.877,P=0.035)、C4OH(OR:0.384,95%CI:0.189-0.779,P=0.008)。并在回归模型系数的基础上,建立了包含上述13个变量的Nomogram。Nomogram中每个变量都被分配了0到100的分值,通过计算各协变量的得分,并计算总分估计早期肺癌的风险概率。(四)评估Nomogram表现首先,我们评估了Nomogram的区分度,通过绘制ROC曲线,计算AUC,在训练集为0.836(95%CI:0.830-0.890),1000bootstrap后C(ROC)为0.860。在验证集为0.781(95%CI:0.722-0.841),1000bootstrap后C(ROC)为0.781,可见Nomogram具有良好的区分能力。其次,我们评估了校准度,通过1000次bootstrap重抽样,校准曲线显示,预测值与实际值基本重合,使用Hosmer-Lemeshow检验,训练集示P=0.064>0.05,验证集示P=0.256>0.05,使用Unreliability检验训练集P=0.837>0.05,验证集P=0.790>0.05,证明模型预测一致性好。最后我们评估了其临床实用性,通过绘制决策分析曲线显示,阈值概率在15%-93%时,Nomogram的净收益高于不处理组和全处理组。(五)比较Nomogram与Ni模型我们将数据引入到既往研究者Ni等人建立的模型,绘制ROC曲线,计算AUC值为0.619(95%CI:0.574-0.664),提示在本数据集中,Ni等人构建模型的区分度低于本研究构建的Nomogram。结论:基于代谢谱构建的Nomogram能够准确预测肺结节患者发生肺癌的风险,并有望在临床实践中应用于肺癌的早诊。