论文部分内容阅读
皮肤是人体抵御外界侵害物质的第一道防线,但因其直接暴露在空气和阳光中,容易由环境、食物,遗传和自身身体素质等诱发皮肤病。皮肤癌是世界上致死率最高的五大癌症之一,研究表明,早期诊断并及时接受治疗是降低皮肤癌致死率最有效的办法之一。但由于相对短缺的医疗资源远远不能满足患者的需求,因此开发基于人工智能技术的自动诊断平台不仅能够大幅缓解医疗资源不足的困境,还能够提高皮肤病诊断效率,并且为医生提供客观的分析结果。然而,现有绝大多数皮肤病自动识别模型均未对其可解释性进行系统探讨,并且无法在大规模数据集上取得良好效果。对高精度识别模型的研究与可解释性系统的探讨,在医疗AI领域具有重要意义。为了提高皮肤病识别模型的精度与可解释性,本文提出了两个深度学习模型——CFPNet与ANGELE算法。此外,为了使其他研究者方便获取医疗AI的分析能力,本文搭建了医学图像在线分析云平台——MCloud。最后,本文基于互联网非结构化与半结构化数据构建了皮肤病知识库,以满足实际应用场景中对医疗AI多样化的需求。本文主要研究工作如下:(1)针对人体多部位皮肤病识别提出了深度级联特征金字塔网络(Cascaded Feature Pyramid Networks,CFPNet)。实验证明,本文提出的CFPNet和当前主流模型相比,在ISIC数据集上皮肤癌病种识别任务中取得了92.83%的准确率、53.97%的敏感度以及54.62%的F1-score;在ISIC数据集上良性恶性皮肤癌识别任务中取得了95.37%的准确率以及74.91%的F1-score;在皮肤病数据集SD-198上取得了68.72%的准确率与66.15%的敏感度,均为当前最佳结果。(2)为了克服部分皮肤病的表观特征存在“类间差异性小,类内差异性大”的问题,本文将度量学习应用到皮肤病识别中,来辅助模型的特征学习并提高分类精度。一系列实验表明了本方法的有效性。(3)与自然图像识别问题不同,医疗AI要求模型具有良好的可解释性,但目前基于深度学习的皮肤病识别模型很少考虑模型的可解释性问题。本文利用Grad-CAM生成患病区域可视化热力图,同时系统分析了模型学习的特征。一方面从可视化的角度提供模型的可解释性,另一方面为医生的复诊提供参考。(4)针对医疗AI对高精度的要求,本文提出了深度集成学习模型——ANGELE(Adaptive uNcertainty-Guided dEep Learning Ensemble)算法,通过对基学习器输出置信度进行建模,有效降低了集成模型的计算复杂度。实验表明,ANGELE算法在SD-198数据集上取得了67.41%的准确率与66.48%的敏感度;在ISIC数据集皮肤癌病种识别任务中取得了92.79%的准确率、53.39%的敏感度以及53.67%的F1-score;在ISIC数据集上良性恶性皮肤癌识别任务中取得了95.22%的准确率以及74.79%的F1-score;均超越了现有模型取得了最佳效果。(5)为了将本文的算法研究成果与实际应用场景相结合,本文基于Python开发了一套皮肤病在线识别云平台——MCloud,通过RESTful API的方式提供相关的医疗AI服务。此外,本文还针对皮肤病的防治、诊断,以及三甲医院等信息构建了皮肤病知识库,为患者提供更完善的医疗AI服务。