论文部分内容阅读
随着21世纪大数据时代的到来,以深度学习为代表的人工智能领域得到广大科研专家们的普遍关注,展现了前所未有的价值。深度学习以其特有的模仿人脑思考、抽象等的特征,已被广泛运用到日常生活工作中,来减轻人工劳动的压力和危险性。其中,医学上的计算机辅助诊断(Computer Aided Diagnosis,CAD)就是被广泛使用的范畴之一,在本文我们主要研究肺癌初期胸部CT影像上肺结节的CAD。传统的CT影像肺结节诊断方式主要依靠医生的个人临床经验,具有较强的主观性,从而导致诊断精确度和可信度较低。因此,追寻科学的诊疗方式来及早地注意到肺癌并使其接受有效治疗,是提升肺癌病人存活率和治愈率的必要手段。为了使海量的CT影像得到有效管理并进一步发掘它们的价值,我们构建了一个肺结节CAD医学影像知识库,用于存储肺癌胸部CT扫描影像的病例数据集。目前在我们这个知识库中包括两个在逻辑上相互独立的关系型数据库—DICOM医学影像数据库和专家诊断数据库。其中DICOM医学影像数据库主要存储CT成像数据集、患者基础信息数据、研究类型数据和序列信息;专家诊断数据库用来存储医生对CT影像上肺结节做出的诊断标注信息,例如肺结节的CT征象信息、位置坐标信息以及类别信息等。本文中的医学影像知识库系统是基于Apache Web服务器来实现的,并使用PHP后台脚本语言来管理和维护两个MySQL关系型数据库。当前在此肺结节医学影像知识库中的肺癌病例集主要来自LIDC-IDRI数据库。肺结节CAD医学影像知识库系统的实现,便于后期对肺部医学CT影像数据以及相应诊断信息的维护和管理,初步探索了有关医学影像知识的表达和推理,并且为接下来基于图像的深度学习分析工作提供可靠的带标签肺结节图像数据,进而实现肺结节的CAD。为了实现对胸部CT影像中肺结节的CAD,我们采用了基于图像的深度学习方法对肺结节进行分类。医学图像分类面临的最大挑战是带标签医学图像数据量非常稀少,而为了减少在深度学习训练过程中出现过拟合情况的概率,我们参考LeNet和AlexNet两个经典卷积神经网络(Convolutional Neural Network,CNN)模型设计了一个浅层CNN—LIDCNet来实现对肺结节的分类,实验包括对肺结节的良恶性进行的分类以及对大结节的恶性度进行的再分类。两个分类实验使用相同的网络模型,实际上相当于实现了一个多分类任务。本文实现的肺结节医学影像知识库为肺结节分类研究提供了可靠的带标签肺结节图像数据。在训练过程中我们首先使用Holdout方法对网络结构以及参数设置进行调试,然后使用十折交叉验证(10-folder Cross Validation)方法验证网络模型的鲁棒性。实验结果表明,LIDCNet模型对胸部CT影像肺结节的上述分类任务都有着很好的应用效果,Top-1准确率都达到95%以上。