基于遗传算法的基因芯片数据聚类研究

来源 :四川农业大学 | 被引量 : 1次 | 上传用户:zhangqin0629
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来基因芯片技术被广泛应用于生命科学及相关的各个领域,它推动了生物学研究的发展。基因表达的模式可以提供有关细胞状态的重要信息,基因芯片技术可以用一个样本同时测量数千个基因的表达情况。 聚类分析技术在分析基因芯片表达数据中扮演了重要的角色。在基因表达数据聚类分析中,使用不同的参数,得到的类结构可能显著不同,k-means算法应用较为广泛。本文首先以k-means算法为基准,对常见的两种类型的基因芯片数据适用的预处理方式和相似度选取进行了研究和分析,结果显示:对于时间序列数据集,对数化转换后,相似度选择协方差所得结果最好;对于非时间序列数据集,对数转化最好,相似度选取欧氏距离、平方欧氏距离、马氏距离都比较好。 由于k-means算法对于初始值非常敏感且易陷入局部极小值,而遗传算法是一种通过模拟自然进化过程搜索最优解的算法,它具有隐含并行性和对全局信息的有效利用能力,将两者结合产生了基于遗传算法的k-means聚类算法-GKA算法,它既能够发挥遗传算法的全局寻优能力,又能兼顾k-means算法的局部搜索能力,更好地解决聚类问题。本文结合参数研究结果,并将自然进化中的优选思想进一步引入GKA算法,提出了新的基于遗传算法的k-means聚类算法-IKGA算法。将该算法应用于酵母基因表达数据集研究,结果显示IKGA算法极显著(P<0.01)的优于GKA算法和k-means算法。 最后将该IKGA算法应用于猪基因表达数据的聚类分析中,结果显示,该算法能很好地避免了初始值对聚类结果的影响,使TWCV值降低,得到了较好的聚类结果。
其他文献
小儿疳积是由于喂养不当,或因多种疾病的影响,使脾胃受损,气液耗伤而导致全身虚弱嬴瘦,面黄发枯等小儿常见的慢性病证.疳积是疳症和积滞的总称.积滞时指小儿伤于乳食,损伤脾
冶金部赴美考察组刘宝深同志报导:耗资4亿美元的宾厄姆铜矿的技术改造(图示) Ministry of Metallurgy Inspection Mission to the United States Liu Baoshen Comrade repo
目的:探究急性应激障碍护理中的心理护理方法.方法:回顾分析2015年10月—2016年10月期间在我院住院治疗的74例急性应激障碍患者临床资料,临床在常规治疗和护理的基础上,给予
为挖掘海门山羊多胎基因资源,建立多胎种羊群,培育高繁殖力海门山羊新品系提供基础材料,本试验以PRLR基因和FSHR基因做为两个候选基因,采用PCR-SSCP技术分析了这两个基因在海
克里沃罗格矿区厚大铁矿床开采中,大规模崩落采矿法得到最广泛的应用。基洛夫矿务局转入深部开采后,采矿技术条件恶化。因此,必需研究已采用的分段崩落法方案和选择最优方案
目的:探讨和总结CRRT联合血液灌流治疗应用于重度蜂蜇伤患者的护理体会.方法:以我院2014年9月至2016年9月期间收治的8例重度蜂蜇伤患者采用CRRT联合血液灌流综合治疗,并给予
现对我院2013年1月~2015年1月共收治的254例急性心机梗死病人的血糖变化情况及临床意义进行分析,报告如下.rn1.病例资料rn2013年1月~2015年1月因急性心机梗死住院病人254例(
目的:了解护士对自身工作满意度及现状并根据影响满意度的自身因素提出相应的解决措施.方法:采用自身设计调查问卷对某综合性三甲医院210名护士进行非概率抽样不记名问卷调查
禽流感(AvianInfluenza,AI)是由A型流感病毒引起的一种禽类的烈性传染病。自1878年意大利首先发现以来,该病目前已经在世界范围内爆发和流行。在16个HA亚型和9个NA亚型中,H5N1高
目的:研究腹外疝病人护理中应用快速康复理念的意义.方法:选择来自我院2014年3月-2015年12月腹外疝病人80例.80例腹外疝病人随机分为常规组和快速康复组.常规组应用常规护理