论文部分内容阅读
研究背景与目的:脑膜瘤是颅内常见肿瘤,有研究发现Ki-67指数与其术后复发、不良预后等密切相关,因此无创预测脑膜瘤Ki-67指数具有重要意义,但相关研究报道较少。本研究拟构建基于影像学、影像组学预测Ki-67指数的模型,并通过相互比较筛选其中预测效能最佳的模型。材料与方法:回顾性纳入资料齐全的脑膜瘤患者,设定Ki-67指数≥3%为高表达组(110例),Ki-67指数<3%为低表达组(108例)。由两位研究者盲法阅片、勾画感兴趣区(Region of interest,ROI)。影像学建模以既往文献报道具有较高辅助脑膜瘤分级或预测Ki-67指数的6个征象(增强扫描强化均匀性、有无假包膜、瘤周大片水肿与否、瘤内有无T2高信号、肿瘤是否跨越大脑镰/小脑幕、骨质有无侵犯)为分析指标,行单、多因素分析。纳入其中有统计学意义的征象,使用支持向量机(Support Vector Machine,SVM)、随机森林(Random Forset,RF)、逻辑回归(Logistic Regression,LR)、分类决策树(Decision Tree Classification,DT)、朴素贝叶斯(Naive Bayesian,NB)、极端梯度提升(Extreme Gradient Boosting,XGBOOST)、提升机器算法(Light Gradient Boosting Machine,LGBM)共7个机器学习算法进行建模,共建立14个基于影像学的模型。影像组学建模于T1WI、T2WI及T1增强序列手动勾画病灶最大层面ROI及全体积ROI,并于T1增强序列最大层面勾画矩形ROI,共生成7个序列-ROI组合。行图像预处理、影像组学特征提取、t检验初步筛选、数据标准化后,使用最小绝对收缩和选择算子(Least Absolute Shrinkage And Selection Operator,LASSO)、互信息法(Mutual Information,MI)、递归消除(Recursive Feature Elimination,RFE)、随机森林嵌套(Random Forest,RFC)筛选特征,经Pearson相关分析去除高相关特征。对4组特征筛选方式获得的特征取并集,除去高相关特征,获得4种特征筛选方式组合结果。对5组特征选择结果使用前述7种机器学习模型建模,建立245个基于影像组学的模型。行影像学机器学习模型与影像组学机器学习模型5折交叉验证,绘制受试者工作特征(Receiver operating characteristic,ROC)曲线,并使用交叉验证曲线下面积(Area under curve,AUC)评价模型预测效能,使用交叉验证相对标准偏差(Relative standard deviation,RSD)评价模型稳定性。比较模型交叉验证AUC及RSD,选出预测效能最佳的影像学机器学习模型与影像组学机器学习模型。将患者以7:3的比例分为训练集和验证集,使用最佳的影像学与影像组学模型进行模型训练及验证,绘制验证集ROC曲线,再行AUC比较及ROC曲线Delong检验对比。结果:1.共纳入218名符合纳入排除标准的患者,两组间性别、年龄单因素分析差异无统计学意义,分级差异有统计学意义,肿瘤增强扫描强化不均、肿瘤假包膜存在、肿瘤周大片水肿、肿瘤内存在T2WI高信号在两组间差异显著(P<0.1);多因素分析提示,肿瘤增强扫描强化不均、肿瘤内存在T2WI号与Ki-67指数呈正相关,肿瘤跨越大脑镰/小脑幕与KI-67指数呈负相关(P<0.05),基于单、多因素分析有意义影像学特征建立的14个影像学机器学习模型中,表现最佳者是基于多因素分析的逻辑回归模型,其交叉验证AUC 0.744,RSD 0.072。2.245个影像组学机器学习模型中,AUC高于0.75,RSD小于0.1的模型共36个,其中T1CE-矩形感兴趣区29个、T1CE-最大层面感兴趣区14个,T1CE-全体积感兴趣区4个,其中预测效能最佳的模型是T1CE-矩形ROI-LASSO-SVM模型,其交叉验证AUC 0.865,RSD 0.062。3.表现最佳影像学模型与影像组学模型相比较,多因素分析-逻辑回归影像学模型验证集上AUC为0.732,灵敏度为0.771,特异度为0.613,T1CE-矩形ROI-LASSO-SVM影像组学模型验证集上AUC为0.822,灵敏度为0.857,特异度为0.645。两模型Delong检验比较ROC,P<0.001。且影像组学机器学习预测模型交叉验证RSD小于影像学机器学习预测模型。结论:1.基于影像学和影像组学的机器学习模型都可较好预测脑膜瘤Ki-67指数,但后者的预测效能、稳定性优于影像学机器学习模型。2.构建影像组学机器学习模型时,T1CE蓄力、矩形/最大层面感兴趣区、LASSO特征筛选方式、SVM建模方式,优于其他序列、感兴趣区、特征筛选方式、建模方式。