基因表达数据的聚类算法研究及其实现

被引量 : 0次 | 上传用户:snsjgl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因芯片技术和先进生物技术的快速发展,基因芯片可以同时对大量的基因表达谱进行快速的测量分析,这就更加速了基因表达数据的产生。如何有效的组织分析、处理这些海量的基因表达数据,从中提取出有效的生物、医学信息已成为人们关注和研究的热点。聚类作为基因表达数据分析的主要技术之一,在研究基因的共同功能、相互作用及协同调控等方面有着广泛的应用。目前应用在基因表达数据聚类上的算法有很多,本文将具有量子行为的微粒群优化算法(QPSO)应用到基因聚类分析当中,并通过实验比较说明了QPSO基因聚类算法的优越性。本文主要做的工作如下:(1)在QPSO算法的基础上,用另外一种目标函数TWCV代替其原来常用的目标函数,构成QPSO基因聚类算法。拥有新的目标函数的QPSO算法应用到基因表达数据聚类上,可以避免基因数据向量出现不均衡分类的情况。(2)结合K-means和QPSO、PSO聚类算法的优点,提出了KQPSO和KPSO聚类算法。并通过实验比较它们与QPSO基因聚类算法在基因表达数据聚类上的优劣性。(3)利用遗传算法(GA)的全局优化特点和K-means的快速收敛特性,形成一种快速遗传算法(FGKA)并把它应用在基因聚类当中。然后通过实验比较QPSO基因聚类算法与FGKA在基因表达数据聚类中的不同表现特性。(4)利用改进的QPSO算法DGQPSO算法去对基因表达数据进行聚类,并与QPSO基因聚类算法在基因表达数据集上进行性能比较。本文最后对要开发的基因聚类分析软件系统GCS做了一个系统界面并对各个模块的功能及界面给予了简单介绍和分析。
其他文献
在电力企业的现代化管理中,计量异常电量的退补是一个重要的管理措施,在全面打破各种人为因素诸如窃电、违约用电等行为上,会给电力企业带来不同程度的损害。本文主要围绕电
莫言的小说作品塑造出了许多个性鲜明的人物形象。这些人物形象表达出对个性自由的理解和极端追求,焕发出顽强的生命力,洋溢着桀骜不驯的野性的光芒。从作家审美取向的动因来
<正>2006年中国老年人口状况调查数据显示,我国农村空巢家庭老人已占全国农村老年人口的38.3%,而安徽等中东部省份空巢比例更高〔1〕。孤独感是空巢老人常见的不良心理现象,
国内外辊子输送机的发展概况机械部第四设计研究院张之仪1现代辊子输送机的概况辊子输送机是一种古老的运输设备。近二十年来,由于家电等工业蓬勃兴起,各种由辊子输送机组成的生
本文采用定量分析的方法,对形容词带“得”字的可能补语、程度补语、比状补语作了较为全面的考察,从一个侧面对形容词的意义和功能作了总结,并对形容词反带的“得”字补语所表达
本文首先介绍变动成本法的基本理论,在此基础上,比较了变动成本法与传统的全部成本法的不同之处,然后结合变动成本法在企业应用的现状,针对其在成本管理过程中各个环节的具体
<正>在建国50周年之际,回顾建国以来党的知识分子政策的演变,反思其是非得失,对于深刻理解、自觉贯彻新时期党的“尊重知识、尊重人才”的知识分子政策,充分调动知识分子的积
目的探讨胰岛素抵抗状态下高尿酸血症与动脉粥样硬化的相关性。方法选取高尿酸血症伴胰岛素抵抗患者(HUA伴IR组)62例,高尿酸血症无胰岛素抵抗患者(HUA无IR组)58例,对照组60例
党的十七大报告强调尊重人民的主体地位。当前,我国弱势群体的主体地位缺乏有力的法律保障。法制的变迁与滞后、权利的分配不公以及权利救济渠道不通畅,是我国弱势群体主体地