论文部分内容阅读
结核病是严重危害人类健康的一类疾病。我国是世界上22个结核病情危险的国家之一,三分之一左右的人口已感染了结核杆菌,人数超过4亿。过去,对疾病的诊断仅仅通过表面现象,现在医学图像技术受到计算机技术发展的推动,可以自动化的完成大量分析工作,协助医生做出诊断并给出详细结果。使用计算机图像处理手段对显微细胞图像的研究和分析,可以通过细胞形态和数量,来判断疾病的病因、研究医疗方案。本文介绍了数字图像处理中常用的色彩模型,如RGB、HSV、CIEL*a*b*等。这些色彩模型为结核菌痰涂片显微图像的色彩分析提供了理论基础。利用这些色彩模型成功的提取出部分结核菌目标特征。同时还介绍了一些主流的图像分割算法,包括阈值分割、区域增长、无监督聚类,这些算法在医学方面都有广泛的应用。其中高斯混合模型是无监督聚类方法之一,本文使用多种色彩模型下提取的特征通过高斯混合模型进行分类取得了较好效果。考虑到医学图像问题的复杂性,还引入了一些主流机器学习方法,例如决策树、贝叶斯分类器、贝叶斯网络方法等。最后使用朴素贝叶斯分类器,结合前文中的色彩模型和结核菌目标的形态特征综合的对结核菌显微图像进行分割,实验结果相比高斯混模型更加健壮。论文的主要工作与创新点如下:1.首先分析了结核菌显微图像整体上的特点,采用了向量量化方法简化图像颜色信息量,然后将图像变换至HSV、CIEL*a*b*等空间。经过对分离后结果的观察,H通道、L通道和a通道具有较好的颜色特征。2.结核菌显微图像非常复杂,不仅结核菌形态各异,背景也包含其他被染色或深色组织,亮度也不均匀。结核菌易受到背景中的甲烯蓝染料所影响,偏离红色色相区域。部分染色太深的区域即使肉眼也难以识别其中的结核菌目标。本文为此引入了高斯混合模型与朴素贝叶斯分类器两种方法。使用高斯混合模型这一非监督分类方法,降低了训练分类器所需的数据量及时间,同时比K-means等方法更加准确。3.对结核菌目标的判断往往需要颜色、形状等多个依据综合判定。基于贝叶斯定理,我们可以首先对数据进行观测,获得先验概率。然后使用先验概率和相似度计算我们希望得到的后验概率。通过建立朴素贝叶斯分类器,可以综合的使用红/绿偏差、色相、形状、面积等多种因素进行目标识别。从实验结果可以看到贝叶斯分类器的分类结果比高斯混合模型更加准确,健壮性也更好。