论文部分内容阅读
随着基因芯片技术和先进生物技术的快速发展,基因芯片可以同时对大量的基因表达谱进行快速的测量分析,这就更加速了基因表达数据的产生。如何有效的组织分析、处理这些海量的基因表达数据,从中提取出有效的生物、医学信息已成为人们关注和研究的热点。聚类作为基因表达数据分析的主要技术之一,在研究基因的共同功能、相互作用及协同调控等方面有着广泛的应用。目前应用在基因表达数据聚类上的算法有很多,本文将具有量子行为的微粒群优化算法(QPSO)应用到基因聚类分析当中,并通过实验比较说明了QPSO基因聚类算法的优越性。本文主要做的工作如下:(1)在QPSO算法的基础上,用另外一种目标函数TWCV代替其原来常用的目标函数,构成QPSO基因聚类算法。拥有新的目标函数的QPSO算法应用到基因表达数据聚类上,可以避免基因数据向量出现不均衡分类的情况。(2)结合K-means和QPSO、PSO聚类算法的优点,提出了KQPSO和KPSO聚类算法。并通过实验比较它们与QPSO基因聚类算法在基因表达数据聚类上的优劣性。(3)利用遗传算法(GA)的全局优化特点和K-means的快速收敛特性,形成一种快速遗传算法(FGKA)并把它应用在基因聚类当中。然后通过实验比较QPSO基因聚类算法与FGKA在基因表达数据聚类中的不同表现特性。(4)利用改进的QPSO算法DGQPSO算法去对基因表达数据进行聚类,并与QPSO基因聚类算法在基因表达数据集上进行性能比较。本文最后对要开发的基因聚类分析软件系统GCS做了一个系统界面并对各个模块的功能及界面给予了简单介绍和分析。