论文部分内容阅读
乳腺癌是女性死亡率最高的癌症之一,每年都有大量的患者因确诊乳腺癌而接受治疗。而癌症常发现于晚期,早期的诊断与发现对患者的康复具有十分重要的意义。其中,癌细胞是否发生转移是判断病程的重要依据。在过去,判断癌细胞是否发生转移的方法主要是病理学家通过浏览患者的病理切片观察细胞状态来确定的。由于医学诊断的专业性,在这方面存在着巨大的人才缺口。随着机器学习的发展,一些计算机自助诊断技术逐渐被应用于各种病理图像的分类和检测任务中,并取得了良好的效果。如逻辑回归、支持向量机、随机森林等。另外,随着数字病理学的发展,图像分析显示出其在组织病理学图像分析方面的优势。这些方法不仅可以加快诊断速度,缓解人才紧缺。还可以有效避免由于疲劳等原因所造成的误诊。近年来,各种基于卷积神经网络的方法在目标识别等任务取得了巨大的发展。然而,在苏木精和伊红染色的数字病理全扫描幻灯片图像中,对转移病灶的检测仍存在挑战。主要原因有两个方面:(1)图像分辨率过大。(2)缺少标注的训练数据。数字病理全扫描幻灯片图像通常存储在多分辨率金字塔结构中,其中包含多个向下采样样本。对于高分辨率的样本,难以将整张图像存入内存。此外,病理图像的标记十分费时与枯燥。为了解决监督学习的数据饥渴问题,非监督学习和半监督学习逐渐出现。他们利用很少或根本不用带标签的数据。这在一定程度上缓解了数据的缺乏,但结果通常不如监督学习有效。本文主要研究了在“块”级水平上的乳腺癌细胞转移分类与检测的问题。为了解决上述提到的挑战,本文提出了一种小样本学习方法来对图像“块”中是否含有癌细胞进行分类。具体来说,从病理图像中裁剪一个“块”A,然后从A中裁剪子“块”B。显然A的细胞数量总是大于等于B。基于此信息,本文利用未标记的图像数据学习细胞计数信息来提取图像的抽象特性。其次,在图像预处理阶段,本文比较了不同的颜色归一化方法对病理图像分类准确率的影响。最后,还对比了采用不同的机器学习分类方法来对从热力图提取的特征进行分类。实验结果表明,与传统的监督方法相比,本文提出的少样本方法能有效地提高“块”级分类精度。