论文部分内容阅读
[目的]探讨基于增强CT提取的影像组学特征在肾透明细胞癌Fuhrman分级及TNM分期术前预测中的应用价值。[方法]从癌症影像数据库(The Cancer Imaging Archive,TCIA)中回顾性收集因肾脏占位性病变接受手术、术后病理证实为肾透明细胞癌的患者,筛选出术前接受过增强CT扫描检查的患者96例,并从该数据库中获取患者的临床信息(包括性别、年龄、Fuhrman分级、TNM分期等)及其术前增强CT影像资料。使用ITK-SNAP软件(v3.6.0)从获取的DICOM格式的肾实质期图像中选择肿瘤实质最大截面勾画感兴趣区(ROI),后将获取的资料上传至放射组学云平台(慧影医疗科技有限公司)进行特征提取,共提取1409个影像组学特征,分别以肾透明细胞癌的 Fuhrman 分级(Grade 1~2/Grade 3~4)、T 分期(T1~2/T3~4)、N 分期(N0/N1)、M分期(M0/M1)为标签,将96例患者以4:1的比例随机分为训练集(n=76)和验证集(n=20),并依次使用方差阈值(variance threshold)法、selectKbest法、最小绝对收缩与选择算子(LASSO)法筛选出相关度最高的特征,使用筛选后得到的最优特征进行机器学习,并分别使用逻辑回归(LR)和随机森林(RF)算法建模。肾透明细胞癌分级和分期的预测模型的效能则通过受试者工作特性(ROC)曲线和敏感度、特异度等参数进行评价。[结果]以Fuhrman分级为标签,筛选出9个影像组学特征,训练集LR模型预测G3~4级肾透明细胞癌的ROC曲线下面积(AUC值)为0.889(95%可信区间:0.79~0.99),灵敏度0.80,特异度0.78;验证集的AUC值为0.648(95%可信区间:0.40~0.90),灵敏度0.69,特异度0.43。训练集RF模型预测G3~4级肾透明细胞癌的AUC值为1.000(95%可信区间:0.98~1.00),灵敏度0.98,特异度1.00;验证集的AUC值为0.780(95%可信区间:0.57~0.99),灵敏度0.62,特异度0.71。以T分期为标签,筛选出16个影像组学特征,训练集LR模型预测T3~4期肾透明细胞癌的AUC值为0.941(95%可信区间:0.86~1.00),灵敏度0.86,特异度0.87;验证集的AUC值为0.823(95%可信区间:0.65~1.00),灵敏度0.88,特异度0.75。训练集RF模型预测T3~4期肾透明细胞癌的AUC值为0.998(95%可信区间:0.96~1.00),灵敏度0.97,特异度0.98;验证集的AUC值为0.865(95%可信区间:0.69~1.00),灵敏度0.88,特异度0.83。以N分期为标签,发现区域淋巴结无法评估(NX)的病例过多,无法进行分析。以M分期为标签,筛选出1个影像组学特征,训练集LR模型预测M1期肾透明细胞癌的AUC值为0.870(95%可信区间:0.73~1.00),灵敏度0.80,特异度0.83;验证集的AUC值为0.941(95%可信区间:0.83~1.00),灵敏度1.00,特异度0.71。训练集RF模型预测M1肾透明细胞癌的AUC值为0.997(95%可信区间:0.98~1.00),灵敏度1.00,特异度0.97;验证集的AUC值为0.951(95%可信区间:0.87~1.00),灵敏度1.00,特异度0.82。[结论]基于增强CT提取的影像组学特征可在术前预测肾透明细胞癌的Fuhrman分级、T分期、M分期,有助于肾透明细胞癌的临床治疗决策。RF模型的预测效能要高于LR模型。RF模型对M分期的预测效能较好,T分期预测效能次之,Fuhrman分级预测效能略差。然而影像组学特征是否能应用于N分期的术前预测还有待未来进一步研究。