基于遗传算法的特征基因选择方法研究

被引量 : 0次 | 上传用户:woaijiekexun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA微阵列技术能够高通量地一次性检测成千上万个基因,这一技术高度自动化、规模化和微型化等特点,使得其可以作为研究肿瘤等复杂性疾病的重要手段。根据肿瘤表达谱数据分析,从大量的基因中挑选有意义的特征基因选择不仅能帮助我们发现与肿瘤相关的重要基因,提高分类能力,并且也降低了临床诊断肿瘤亚型的成本。一个成熟的特征基因选择方法不仅能产生具有较好分类性能的子集,并且该方法应该同时具有较好的鲁棒性。然而微阵列数据的显著特点是样本少、维度高,而据相关研究证实,这种数据更容易造成特征选择方法的鲁棒性较低。但是,现有大多的特征选择方法只关注算法的分类准确率指标,而忽略算法的鲁棒性指标,而鲁棒性差则会大大降低临床诊断的可信度。为了克服现有方法在兼顾鲁棒性以及预测准确率的不足,我们提出了一种基于遗传算法的特征基因选择方法。该方法首先利用基于累积偏差的方法剔除异常数据,以避免异常数据为后续基因选择带来负面影响。紧接着,为了提高算法的鲁棒性,我们借鉴融合分类器思想,提出融合多个基本过滤准则的综合评价方法,该方法利用不同准则在样本数据分布刻画的侧重点不同的特性,设计一种加权打分的多准则融合方法对基因进行初步筛选,该方法由于不仅考虑了多个准则之间的互补性,而且同时可以充分考虑多个准则之间的相对重要性,因此,它对于各个单个基因的评价更为客观、更为全面,从而避免单个准则的片面性。更重要的是,与以往方法不同之处在于,在基因初选阶段,我们只利用多准则融合进行筛选而并不进行排序,这样可以避免因为排序的偏差影响而对后续精选过程带来负面影响,最后利用遗传算法的对基因初选结果进行基因组合空间搜索,以寻找最优的特征基因组合。实验证明该方法有效保留了因为单个准则的偏袒性而被错误淘汰的有效特征基因,从而具有更好的预测准确率,并且具有更好的鲁棒性。
其他文献
艺术表现力是冰舞运动员动作完美的体现,也是运动员表现动作丰富的情感和完成动作质量的体现.目前我国冰舞运动员还存在较大差距.从表演意识、身体素质、动作质量和对音乐的
1项目概况南广500k V变电站是抚州市重点工程,为解决该市长期存在的供电半径长、低电压问题,建成后可有效提高该地区电网运行灵活性和可靠性。本期建设规模主变容量1×75
目前,国内的市场经济体制在社会进步的推动之下继续健全,同时,企业的财务管理也随之改变。当前,为更好地适应社会发展,许多企业转变管理理念、将财务管理精细化,目的是提高资
油脂化工产业对我国的社会经济发展具有非常重要的促进和支持作用,近年来我国的油脂化工产业内部的竞争日益激烈,行业利润率持续走低。在这种背景之下,油脂化工企业必然需要
乏氧现象广泛存在于实体肿瘤中。乏氧诱导因子-1α(hypoxia inducible factor 1α,HIF-1α)通过参与多种靶基因的转录调控影响肿瘤细胞的能量代谢、增殖和凋亡,使细胞及组织
根据光寻址电位传感器(LAPS)原理,提出一种结合主成分分析和反向传播(BP)神经网络识别溶液味觉的方法。对LAPS电子舌采集的味觉数据主成分进行提取,将该主成分作为BP神经网络的训
目的观察优质护理在小儿肺炎护理中的应用及效果。方法将90例小儿肺炎患儿分成对照组与优质组,每组45例,其中对照组采用常规护理方案,优质组应用优质护理方案,对比观察护理效
基本公共服务现代化是社会现代化的重要内容。当前,我国基本公共服务能力与经济社会发展水平和要求、人民群众日益增长的公共服务需求、发达国家公共服务水平相比,仍有一定差