论文部分内容阅读
目的:骨转移是恶性肿瘤晚期常见的转移方式之一,是否出现骨转移对患者的预后有很大影响。目前诊断骨转移首选的检查是全身骨扫描(Whole Body Bone Scan,WBS),但WBS图像本身具有分辨率低、部分良恶性病灶表现相近、影像学特征不明显等缺点。在实际工作中为了确保诊断的准确率,需要医生具备丰富的诊断经验并结合其他影像学检查和病史等对图像中的病灶进行综合评估。近些年人工智能(Artificial Intelligence,AI)在医学影像学中得到了广泛的应用且取得的很好的成绩,尤其是深度学习网络可以通过大数据的分析并总结,明显提高影像诊断的准确性,缩小不同经验影像医师之间的差异。目前应用于WBS诊断方面的目标检测深度学习AI模型较少,本研究将基于Yolov5目标检测深度学习网络,训练出可以对WBS良、恶性病灶进行标记并分类的AI模型。材料和方法:1.研究对象:本研究回顾性收集了大连市中心医院2018年1月至2020年1月期间行WBS患者的前、后位图像6336张,经纳入标准和排除标准后最终收录2111张图像。得到的图像由同一位核医学医生进行预处理操作。2.金标准制定:两位高年资核医学医生根据自身经验并结合患者以往的病理报告、WBS报告、计算机断层扫描成像(Computed Tomography,CT)图像、磁共振成像(Magnetic Resonance Imaging,MRI)图像、检验结果及患者病史对WBS图像中每个病灶进行良、恶性诊断。当诊断意见不统一时,会请第三位高年资核医学医生讨论并决定该病灶的良、恶性。本研究将恶性肿瘤骨转移病灶设定为恶性病灶,将骨折、退变、炎性病灶设定为良性病灶。3.模型的构建:根据金标准进行病灶标记后,将数据集分组,80%作为训练集与验证集,20%作为测试集,其中训练集与验证集之比为9:1。为了提高模型的泛化能力及鲁棒性,对训练集与验证集进行数据增强,通过镜像及旋转将图像及对应标签数量扩增到原来的4倍。数据增强后的训练集与验证集共包括18452个恶性病灶,11776个良性病灶,未经增强的测试集包括1117个恶性病灶及722个良性病灶。将数据增强后的训练集与验证集上传至华为云Model Arts云端图形处理器(Graphics Processing Unit,GPU)中,输入Yolov5目标检测深度学习网络进行训练。4.模型的评价:在验证集中,计算模型的查全率、平均精度及平均精度均值(Mean Average Precision,m AP@50)。在测试集中,计算模型的敏感性、特异度、准确率、查准率、F1-score及总准确率。在测试集中,请低、中、高三位不同年资的医生对测试集进行标记,且在标记过程中不向医生组提供其他额外信息,将医生组的标记结果并与模型标记结果进行对比,并统计模型与医生组的标记时间。5.统计学方法:用Kappa一致性检验,检验模型及医生组的标记结果与金标准之间的一致性。结果:1.模型在验证集中的结果:模型预测M病灶的查全率为98.2%,预测B病灶的查全率为96.3%。模型预测M病灶的平均精度为0.967,预测B病灶的平均精度为0.945,m AP@50为0.956。2.模型在测试集中的结果:模型预测M病灶的敏感性为96.1%、特异度为94.1%、查准率为96.8%、F1-score为0.964,预测B病灶的敏感性为94.1%、特异度为96.1%、查准率为95.0%、F1-score为0.945,总准确率为96.1%,平均F1-score为0.955。其中各项数值较医生组明显更高。3.模型及医生组的标记结果与金标准之间做Kappa一致性检验:模型与金标准之间(Kappa=0.902,P<0.001),低年资医生与金标准之间(Kappa=0.494,P<0.001),中年资医生与金标准之间(Kappa=0.635,P<0.001),高年资与金标准之间(Kappa=0.791,P<0.001)。结论:本研究回顾性收集了2111张WBS前、后位图像,基于Yolov5深度学习神经网络,训练出应用于WBS图像全身整体的AI病灶自动识别模型。模型对恶性病灶及良性病灶均表现出了极高的敏感性、特异度、查准率、F1-score以及总准确率,并且本模型是目前唯一一个可以标记良性病灶的基于深度学习网络的WBS全身病灶检测模型,从一定程度上弥补了当前领域的空缺。在测试集中,模型的标记结果比三位医生的标记结果更加灵敏、准确且用时更少,经过Kappa一致性检验得出模型的标记结果与金标准几乎一致,Kappa值明显比低、中、高三位不同年资医生高。我们的模型比医生有更高的诊断效能,对于临床辅助诊断有一定的价值。