论文部分内容阅读
基于机器学习的模式识别系统通常由两部分组成:特征提取和分类。针对特征提取,本文既尝试了手工设计新的特征,又研究了学习来的特征的优势。由于通常情况下,集成分类器优于单个的基分类器,本文选择集成分类器作为模式识别器。总之,本文主要研究集成学习和深度学习及其应用,并针对细胞膜的分割和视网膜的分割分别提出了对应的解决方法。本文的研究内容主要有两部分:基于层次级特征和随机森林的细胞膜分割方法、基于特征学习和集成学习的层次级视网膜图像分割方法。提出一种基于层次级特征和随机森林的细胞膜分割方法。鉴于细胞显微图像的局部聚簇性,首先定义和提取了层次级特征HLFs,层次级特征可被视为一种更合理、更自然的特征表示方法。然后,将层次级特征用于训练随机森林来进行细胞膜的分割,进而提出针对细胞膜分割的HLFs-RF方法。在ISBI2012竞赛数据集上的实验结果表明:1)层次级特征整合了特征表达丰富的像素级特征和具有一定语义特征的超像素级特征的优势。2)与原有固定大小和形状的方形窗邻域下上文信息相比,层次级特征能够自适应的调节单个像素点周围的邻域信息,较好的描述了局部错综复杂的微观结构,提高了用于细胞膜分割的模式识别系统的识别性能。3)而且,与同类方法相比,HLFs-RF方法即使在低维特征和小样本的情况下,依然能取得良好的实验效果。同时,还提出一种基于超像素的典型样本点选择方法,精简了样本空间,减少了样本之间的冗余。提出了一种基于卷积神经网络和随机森林的层次级视网膜图像分割方法。由于CNN能够自行从原始图像学习到具有普适性的特征,传统分类器RF又具有优越的分类性能。这就很自然的想到整合CNN和RF两种分类器的优势,使得整个模式识别系统的流程都是全自动的(automatic)和可训练的(trainable)。具体来说,CNN的作用是可训练的层次级特征提取器,然后选择随机森林来训练CNN提取到的层次级特征。值得指出的是对于学习来的特征,本文不仅使用了CNN最后一层的特征,还使用了中间层的特征。并将CNN各层学习来的特征分别用于训练随机森林,最后将各个随机森林的输出结果采用胜者为王集成学习方法进行集成。本文提出的基于层次级特征和随机森林的细胞膜分割方法,层次级特征具有很强的区分力,所提方法取得了良好的分割效果。后续工作重点主要集中于两方面:一方面是更有区别力的超像素特征的定义和提取;另一方面是设计使用新的分类算法以使HLFs得到更好的利用。整合特征学习和传统分类器的研究不但具有重要的理论意义,还有广阔的应用空间。本文提出的基于特征学习和传统分类器的视网膜图像分割方法在两个数据库上都取得了非常好的实验效果。后续工作将关注于算法运行效率的提高,尝试使用其他深度学习方法,以及将该框架应用于其他领域。