基于蚁群聚类的特征基因选择算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:yong5665
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,生命科学进入了一个前所未有的新时代。生物学家们通过DNA微阵列技术能够同时检测成千上万个基因,使得他们对肿瘤细胞有了一个宏观的认识。然而由于这一技术高度自动化、规模化以及微型化,基因芯片数据存在维度高、样本少的特点。如何有效分析并处理这一技术所产生的大量数据并找到对疾病研究与治疗有意义的基因子集,已经成为了该领域研究的重点以及难点。蚁群聚类算法依据蚂蚁打扫墓穴原理发展演变而来。首先,将数据对象随机地投影到一个平面,然后每只蚂蚁随机地选择一个数据对象,根据该对象在局部区域的相似度而得到的概率,决定蚂蚁是否“拾起”、“移动”或“放下”该对象。经过有限次迭代,平面上的数据对象按其相似性而聚集,最后得到聚类结果和聚类数目。近些年来相关群智能算法已经广泛应用到基因选择方法中来,并取得了不错的效果。本文提出了一种基于网格的蚁群聚类算法。该方法首先将数据随机分布到一个二维平面上,该平面有m m有个网格组成。然后在该平面上产生一些虚拟蚂蚁对数据对象进行聚类分析。近年来,国内外研究学者纷纷提出各种基因选择方法,但仍存在诸如基因共线性、缺乏组合基因的考量以及整体运算复杂度的问题。为了解决这些问题,本文提出了一种基于蚁群聚类的特征基因选择方法。首先,我们采用过滤法依据基因自身所包含的表达差异信息对基因进行打分,并删除分值低于阈值的基因。随后我们采用蚁群聚类算法来删除冗余基因。我们采用支持向量机作为分类器,并对四个肿瘤数据集进行实验仿真。实验结果证明我们的方法能够有效解决上述问题。
其他文献
无线传感器网络由大量的微型、廉价、低功耗的传感器节点组成。这些传感器节点不仅能够探测包括地震、温度、湿度、噪声、光强度、压力、土壤成分、移动物体等多种多样的现象
交通系统智能化的快速发展,设施设备特别是卡口数量的快速提升,使得过车记录飙升,形成大规模数据。卡口系统中,用户常常需要对车牌号进行精确或模糊查找,同时要求数据检索系
机器视觉是用计算机来模拟人的视觉功能,其中非常重要的一环就是图像处理。特征提取是图像处理中的一个重要研究方面,而角点是图像中非常重要的特征,包含丰富的图像信息。角
H.264是由ISO(国际标准化组织)与ITU(国际电信标准化部门)联合制定的新一代视频编码标准。H.264具有较高的压缩率、较好的图像压缩质量以及网络亲和性,因此在存储和网络传输
在互联网技术飞速发展的今天,Web服务在Internet上的应用不断扩展,电子商务等Web服务应用已经被广大用户所熟知,成为了大家日常生活的一部分。Web服务在给使用者带来很多便利
在当今社会中,教育伴随着人的一生。随着现代网络技术的发展与信息技术的应用普及,计算机教育信息系统的可视化研究成为当前教育的一个热点。教育信息系统层面很多,我们主要
学位
网络入侵检测是保障计算机网络安全的重要技术,现行的入侵检测主要是依靠领域专家的经验和知识,难以应对各式各样的网络攻击。本文在对网络入侵检测的研究现状进行分析之后,
氧气在医疗、冶金和化学工业等领域有着广泛的应用,而这些应用,对氧气的浓度都有着严格的要求。因此,以一种便于使用的方式,精确地测量氧气浓度,对提高产品质量、保证生产环
问答系统是目前自然语言处理领域中的研究热点之一,它以精准的答案直接回答用户以自然语言方式表达的问题。在问题分析时,提取问题中的关键词对于理解其语义至关重要;在问题
随着网络技术的发展,大规模分布式计算及数据共享技术的进步,分布式数据流已经广泛存在于金融风险分析、无线传感器网络、网络入侵检测等应用中,发现其中蕴含的知识是目前国