论文部分内容阅读
根据世界卫生组织2016年最新数据显示,肺癌在全球的发病率和死亡率均为最高。肺癌在早期的表现几乎没有任何症状,并且患者发现时大部分已经是晚期。那么及早的发现肺癌提高生存率就显得十分重要。肺癌在早期一般是以结节的形式存在的。那么及早的发现肺癌就变成及早的发现肺结节。对于医生而言,由于主观性及其他因素的影响,从大量的CT图像中甄选出肺结节就极易造成误诊和漏诊。所以,借助于计算机辅助诊断(computer-aided diagnosis,CAD)就显得特别的重要。半监督学习是近年来许多学者研究的热点,半监督FCM算法作为半监督聚类算法中比较经典的算法之一,凭借着算法中比较低的复杂度,以及在实际问题中获得比较好的应用效果,而受到广大学者的青睐。肺结节的良恶性分类对于肺癌的早期发现以及诊断具有十分重要的意义。然而在实际应用中,标记样本的图像数量较少,且获取标记样本将耗费大量的人力,在这种情况下,使用半监督学习算法是有效提高分类性能的一个思路。作为一种经典的半监督学习算法,传统的半监督FCM在未标记样本与标记样本分布不平衡情况下不能充分利用标记信息。针对这一问题,本文提出了两种改进的半监督FCM算法,主要工作如下:1.基于先验分布的半监督FCM的肺结节分类,主要是为了解决标记样本数量远少于非标记样本数量,而导致的传统的半监督FCM退化为经典的FCM,因此而导致的肺结节分类正确率较低的现象。基于这一现象,文章提出了一种基于先验分布的半监督FCM算法。该算法的基本思想是首先计算样本的先验分布概率,基于获得的先验概率情况下,给标记样本和未标记样本赋予不同的权重,并将其融入到半监督FCM的聚类过程中,从而强化少量的标记样本在聚类过程中的指导作用。文章中提出的算法通过在美国LIDC数据库上的实验证明,与经典的FCM算法、部分监督的FCM算法以及传统的半监督FCM算法相比较,提出的算法能够取得更好的肺结节分类性能。2.基于粒子群的改进的半监督FCM的肺结节分类。针对基于先验分布的半监督FCM算法在不平衡数据集时分类准确率明显提高,但是在平衡数据集时分类准确率效果不明显这一情况,以及半监督FCM算法分析时无法提前预知数据集是否平衡这一问题。所以本文基于上述问题提出了一种基于粒子群的改进的半监督FCM算法,通过引入样本的容量信息来减少不平衡数据集的影响,同时使得所改进的算法对平衡或者不平衡数据集都具有普遍适用性,实验证明,文章中所提出的基于粒子群的改进的半监督FCM方法具有较好的适用性。