基因微阵列数据分析中的基因选择与聚类方法的研究

来源 :江苏科技大学 | 被引量 : 2次 | 上传用户:blueblacktzb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组项目的不断完成,产生了大量有待于分析和解释的生物信息,从而,人们可以从分子水平上了解基因的表达模式和微观层面上研究生命现象。基因芯片技术是生物信息研究的主要领域之一。通过此技术,可以同时检测成千上万个基因在生物体内的活性,但同时还会产生大量的微阵列数据。基因微阵列数据具有样本小、维数高、噪声大、冗余基因大量存在、分布不平衡等特点。如何从这些数据中挖掘有用的生物信息并使这些信息对疾病的检测和分型提供有效的指导,成为模式识别与数据挖掘领域研究的主要内容之一。本文主要围绕基因微阵列数据的基因选择和聚类方法开展研究,主要工作如下:1.基于神经元激活函数提出了一种改进的遗传算法。其主要思想是利用神经元激活函数改造变异和交叉算子,同时考虑到类内距离和类间距离的关系来改进基本的遗传算法。2.在充分考虑基因微阵列数据特点和遗传算法的优缺点的基础上,本文利用改进后的遗传算法进行K均值聚类。以白血病数据集为研究对象,利用改进的遗传K均值聚类进行实验仿真。实验结果表明,此方法应用在基因微阵列数据特征选择的问题中,获得了较好的分类效果;比常用的聚类算法分类准确率更高,同时也降低了基因维数。3.在考虑到基因微阵列数据样本小、维数高的基础上,本文提出了一种粒子群算法和样本聚类的错误率相结合的基因选择方法。之后,利用癌症数据进行实验仿真,通过实验,发现此方法可以获得较小的且分类能力较强的特征子集。
其他文献
氢气因其高效、清洁、储量丰富被认为是21世纪最有潜力的新型能源,质子交换膜燃料电池(PEMFC)是将氢能转化为电能的装置,测控系统主要用于监测与控制燃料电池的运行状态,确保电池可靠、高效的运行。本文基于虚拟仪器软件平台,设计了百瓦级风冷型PEMFC测控系统,论文内容包括:1、通过实验研究了电堆温度、负载电流、氢气流量、氢气压力等参数对电池发电性能的影响,根据实验数据给出了电堆最佳工作温度和电磁阀排
随着P2P网络在文件分发、即时通讯和匿名通信等领域的广泛运用,随之而来的网络安全问题也受到了社会各界的关注,信任模型作为应对安全问题的重要机制广受关注。本文在现有的P
免疫粒子群算法(IPSO)是一种基于免疫算法理论进行改进的粒子群算法。为解决粒子群算法(PS0)多样性差、易陷入局部最优解、“早熟”收敛等问题,本文引入了免疫算法的免疫记忆和抗体促进、抑制模块,并加入了自适应交叉变异率对粒子群算法进行改进。新算法中,免疫记忆可保证算法的收敛性,抗体促进、抑制可有效的确保粒子的聚集程度的合理性,自适应交叉、变异算子则极大的丰富了粒子的多样性,并增强局部搜索能力。通过
随着GPS和SINS的广泛应用,其研究也在不断深化。国内外学者提出了大量的实现方案和优秀算法,目前已有一些设备能够辅助完成这些算法方案的实际工程测试与验证,但由于构建验证系
航行在海洋中的船舶由于受到海浪作用会产生摇荡运动。对于带有舰载机的大型船舶,船舶的摇荡运动会威胁舰载机起降的安全。所以在设计此类舰船时,船舶的耐波性是设计者应着重考
随着网络相关技术的发展,越来越多的信息尤其是文本相关数据资料迅速增长,人们需要在海量的信息中及时获取有用的或者自己感兴趣的内容。这是互联网信息内容处理领域急需解决的
相比于单机器人,多机器人系统具有诸多优点,其应用场合遍及城市环境侦察、灾难搜索与救援、仓储管理等方面,但仍然面临着如体系结构设计、任务分配、协调控制等问题。本文围
随着人类的发展和社会的进步,由废塑料产生的环境污染问题和日益严重的能源短缺问题始终困扰着人类。废塑料炼油工业将其收集的废塑料运用在炼油工业中,能有效地缓解环境污染和
随着通信、电子和计算机的发展,工业控制系统也在逐渐发生着变革,并且对实施性能的要求也逐渐增高,例如在信息传递过程中要求快速传递,现场设备要求快速控制,上位机的显示与
学位