论文部分内容阅读
医学影像相对其他检测手段而言更为直观易得,被广泛应用于诊断各种疾病。基于医学影像的计算机辅助诊断能够节约医生的精力,实现疾病的早期筛查,对病人的预后有重要意义。医学影像计算机辅助诊断一般都基于图像中的细微差别以区分同一个器官的不同疾病,这完全符合自然图像领域中细粒度图像分类问题的定义。因此,本文从细粒度图像分类的思路出发,通过引入定位信息进一步提升分类性能。本文所提出的方法使用弱监督的处理流程,仅需要类别标签即可定位。针对医学影像数据量少的特点,本文基于两级注意力机制,提取并融合全局与局部的信息以提高分类性能。全局图像与局部图像分别使用独立的深度卷积神经网络处理,获得基于全局图像的类别得分与基于局部图像的类别得分,并融合获得最终的分类结果。针对医学影像专业性强,难以获得额外定位标注的特点,本文基于自下而上的思路,设计了弱监督的局部图像提取方法。首先基于输入图像产生一系列候选框,然后根据神经网络可视化技术提取的定位信息为其评分,以从中筛选出对分类有帮助的区域。本文在实际病例数据中进行了大量实验,以检验方法的有效性。在基于耳镜图像的中耳炎分类问题上,实验验证了融入定位信息能够带来稳定的提升。在此基础上,本文进一步收集了由病理样本活检结果作为标签的喉镜图像数据集,在喉癌识别问题上探索了不同融合策略、不同定位图产生方法、不同区域提取方法以及局部图像数量对分类准确率的影响,并与一系列现有方法进行对比。实验表明本文所提出的方法在不同类型的医学图像分类问题上表现良好,具有较好的泛化能力。