论文部分内容阅读
随着人类基因组计划的完成,DNA测序开始发挥其重要的作用。传统的测序方法有:板凝胶电泳法和毛细管电泳法;新一代的测序方法有:杂交测序,合成测序和单分子测序。如何能够快速、准确、高通量的实现DNA测序是将来研究的重点。基因芯片与DNA测序的结合,使得以上这些要求都将成为可能,而且可以大大降低成本。我们采用滚环扩增方法制备测序模板,然后通过合成测序的方法进行DNA序列的检测。
在对测序芯片的研究过程中,需要生物信息学的分析,生物芯片图像处理即是这个过程中的一个重要部分。特别是对于不同生物芯片上的大量分子特征荧光点进行识别、分析和配准,一将特征点的灰度信息联合起来,就可以得到待测DNA的序列。
本文主要针对芯片图像分析中的算法进行研究,对测序芯片的图像处理,对分子特征荧光点进行识别、分析和配准。主要研究工作分为三个方面:
(1) 对芯片图像上特征点的提取,这里研究了两大类方法:边缘提取和阈值分割,在不同的芯片图像中采用不同的特征点提取的方法。边缘提取方法主要研究四种经典算子:Sobel、Prewitt、LoG、Canny,由于图像中噪声比较明显,背景并不均一,因此在没有设定阈值的情况下,四种算法都不能有效的提取我们所处理的测序芯片中的特征点,对于不同阈值下的提取效果,这里采用了方差分析作为判断标准,最后采用Canny算子提取图像特征点。对于边缘提取算法不适合的图像,采用直接阈值分割的方法,这里的阈值采用迭代阈值的方法进行计算,并且发现将图像分割为若干子图像再进行直接阈值分割更为合适;
(2) 对图像的特征点提取以后,计算图像特征点的质心,也就是特征点的灰度中心,作为特征点的唯一标识;
(3) 由于测序是个动态过程,因此需要对一系列图像进行配准,这里采用了互信息配准的方法,此方法不需要考虑整个图像中每个点的轮廓外型等信息,只需要考虑整个图像的灰度信息,这对于我们所处理高密度点阵图像比较合适,这里将图像进行平移旋转,计算待配准图像与固定图像之间的互信息值,从中得到最佳的互信息值,也就是最匹配的变化。