论文部分内容阅读
背景甲状腺结节是临床常见病之一,具有较高的发病率。高达65%的无症状成人可通过超声检查发现甲状腺结节,其中大多为无须过多处理的良性结节。此外,甲状腺结节的恶性率仅约10%,且大多数恶性结节(特别是小于1cm的结节)表现为惰性,预后良好。目前,超声是公认用于诊断甲状腺结节的首选检查手段。随着人群健康意识的增强及超声医学技术的发展,高频超声对甲状腺结节的检出率不断提高,而超声医师对甲状腺结节的诊断水平参差不齐,容易无法准确评估甲状腺结节的良恶性风险,从而导致许多甲状腺良性结节导致许多甲状腺良性结节进行了不必要的细针穿刺活检和(或)手术治疗。因此,如何准确地评估甲状腺结节的风险程度、鉴别其良恶性,并合理指导细针穿刺活检和(或)手术治疗是减少临床实践中过度诊疗的关键。为提高超声对甲状腺结节的诊断准确性,学者们提出了许多甲状腺结节超声指南,包括:①2017年美国放射学会(American College of Radiology,ACR)发布的甲状腺影像报告与数据系统(Thyroid imaging reporting and data system,TI-RADS)(ACR TI-RADS);②2015年美国甲状腺协会颁布的《成人甲状腺结节和分化型甲状腺癌的管理指南》;③2021年中国中华医学会超声医学分会浅表器官和血管学组发布的《甲状腺结节超声恶性危险分层中国指南:C-TIRADS》等。上述甲状腺结节超声指南各有千秋,均具有一定的临床应用价值。既往研究表明,与其他指南相比,ACRTI-RADS可提高超声医师对甲状腺结节风险分层的准确性且其不必要活检率最低。然而,不同年资超声医师运用ACR TI-RADS诊断甲状腺结节时具有经验依赖性和诊断差异性。此外,ACR TI-RADS细化了甲状腺结节的超声特征,这使超声医师在临床实践中操作复杂化且耗时。针对ACRTI-RADS指南的诸多问题,人工智能(artificial intelligence,AI)的出现使得降低甲状腺结节的超声诊断操作者依赖性成为可能。研究表明,深度学习AI模型的诊断效能可和放射专家相媲美,有助于进一步提高超声对甲状腺结节的诊断准确性。但深度学习AI模型的学习机制目前仍不明确,即“黑盒”机制,意味着人们无法得知其预测结果的依据,也无法判断其预测结果的可信度。故深度学习AI模型的可解释性至关重要。因此,本研究拟将人工智能技术自主提取图像特征的优势与高年资超声医师如何分析声像图这一临床先验知识进行强强联合,构建一个基于ACR TI-RADS超声特征的深度学习AI模型;并进一步探讨该模型在诊断甲状腺结节良恶性和识别甲状腺结节超声特征的能力。目的研发一个基于ACR TI-RADS超声特征的深度学习AI模型(MTIRADS),以辅助诊断甲状腺结节良恶性并识别结节超声征象;进一步比较该模型与不同年资超声医师对甲状腺结节良恶性诊断的效能及甲状腺结节超声征象识别的能力差异,探讨该模型能否提高超声医师对甲状腺良恶性结节的诊断准确性。方法回顾性收集1588个经手术病理证实的甲状腺结节,来源于636名甲状腺结节患者,其中485名女性,151名男性,平均(49±14)岁。采用2018年01月至2019年12月的1345个甲状腺结节二维声像图作为训练集,构建两个深度学习AI模型:一个为基于ACR TI-RADS超声特征的深度学习AI模型(MTIRADS),另一个为未结合ACR TI-RADS超声特征的传统深度学习AI模型(MDiag)。采用2019年01月至2019年12月的243个甲状腺结节二维声像图作为测试集,比较MTIRADS与不同年资超声医师诊断甲状腺结节良恶性和识别结节超声特征的能力差异。此外,本研究还比较了两个AI模型即MTIRADS和MDiag诊断甲状腺结节良恶性的效能差异。结果1.一般情况本研究中训练集的1345个甲状腺结节均来自于外院(A医院),其中433个结节为恶性,912个结节为良性。另测试集的243个甲状腺结节均来自于本院,其中恶性结节66个,良性结节177个。2.两个深度学习AI模型(MTIRADS和MDiag)诊断甲状腺结节的效能比较本研究运用1345个甲状腺结节二维声像图作为训练集,成功构建了两个深度学习AI模型。在测试集中,基于ACRTI-RADS超声特征的深度学习AI模型(MTIRADS)的AUC、灵敏度、特异度、阳性预测值和阴性预测值分别为0.91(95%CI:0.87、0.95)、83%、87%、71%和 93%。未结合 ACR TI-RADS 超声特征的传统深度学习AI模型(MDiag)的AUC、灵敏度、特异度、阳性预测值和阴性预测值分别为 0.84(95%CI:0.79,0.89)、73%、91%、75%和 90%。MTIRADS的AUC高于MDiag的AUC(P=0.001),而MTIRADS的灵敏度和特异度与MDiag的灵敏度和特异度的差异均无统计学意义(P=0.07;P=0.12)。3.MTIRADS和不同年资超声医师组诊断甲状腺结节的效能比较测试集中,MTIRADS诊断甲状腺结节良恶性的AUC和灵敏度分别为0.91和83%,与高年资超声医师组的差异均无统计学意义(0.93,P=0.45;92%,P=0.07),但高于低年资超声医师组(0.78,P<0.001;70%,P=0.04)。MTIRADS的特异度为87%,均高于高年资超声医师组(80%;P=0.02)和低年资超声医师组(75%;P=0.001)。4.MTIRADS和不同年资超声医师组识别甲状腺结节超声特征的能力对比在识别甲状腺结节的结构、回声、形态、边界光滑或模糊方面,MTIRADS和高年资超声医师组之间的一致率高于MTIRADS和低年资超声医师组之间的一致率,分别约 79%vs 73%(P=0.02),75%vs 68%(P=0.04),93%vs 88%(P=0.04)和72%vs 63%(P=0.002)。对于识别边缘是否呈分叶状或不规则、是否有甲状腺向外侵犯、大彗星尾征、粗大钙化、边缘钙化和点状强回声方面,MTIRADS和高年资超声医师组之间的一致率与MTIRADS和低年资超声医师组之间的一致率的差异均无统计学意义(P>0.05)。结论MTIRADS诊断甲状腺结节良恶性的能力与高年资超声医师组的诊断能力相媲美,且优于低年资超声医师组的诊断能力;MTIRADS识别甲状腺结节的部分超声特征的能力也优于低年资超声医师。因此,MTIRADS可有效地辅助低年资超声医师诊断甲状腺结节,提高其诊断准确性。此外,结合重要的超声知识有助于进一步提高深度学习AI模型的诊断效能,并使其对甲状腺结节的预测结果更有效、更可解释。