肿瘤基因表达谱分类的特征基因选择研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:furong2599
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,恶性肿瘤的治疗依然是当今世界的难题,发病类型多样而且难于治愈。早期诊断和精确分类有助于对患者进行有效的临床治疗,在最大程度上挽救宝贵的生命。当今,对肿瘤诊断和分类的主要手段是通过组织病理学特征进行判断的。但是,这个方法有一个固有的缺点。因为,某些肿瘤类型的组织病理学特征很相似,但是在临床治疗反应和预后上具有显著差异,这容易导致病患接受不利治疗。基因芯片技术是一种可以高通量研究基因表达变化的分子技术,通过基因芯片技术可以大规模检测肿瘤的基因表达情况,从而获得肿瘤基因表达谱。因为肿瘤在基因表达变化方面呈现高度的异质性,通过肿瘤基因表达谱可以区分那些组织特征相似的肿瘤类型,从而实现对恶性肿瘤的早期诊断和精确分类。因此基因芯片技术具有很大潜力发展为对肿瘤实现简便、快捷诊断与分类的工具,这无疑可以对患者和社会带来巨大的益处。基于基因表达谱的分类包含两个重要的部分:特征基因选择(feature gene selection)和分类器构建(classifier construction)。在基因表达谱获取过程中,由于非特异性杂交等原因,产生于基因芯片技术的基因表达谱数据具有较大的实验误差。同时,由于实验成本较高导致实验样本很少,而检测的基因数目很多可达上万,这导致基因表达谱数据包含大量的无关基因,是典型的高维、高噪问题。另外,由于存在大量相关性很强的基因,导致分类上存在的冗余信息很多。对于这种充满冗余信息且高维高噪的数据,通过特征选择获得与疾病相关的特征基因对于分类问题显得尤为重要。GA/KNN方法是一种成功的wrapper式特征基因选择方法。自提出以来,其实用价值已在国际上获得广泛认可。我们在MATLAB下实现了GA/KNN方法,并通过实验验证了我们的实现过程,最后我们对GA/KNN的成功之处进行了总结。在总结已有工作成果的基础上,我们尝试提出了一种新的特征选择方法GA/WV。通过公开的基因表达谱的数据分析实验验证,证明我们的GA/WV可以应用到二类或多类的特征基因选择问题,并对我们的GA/WV方法的某些性能进行了摸索。因为噬菌体展示蛋白芯片数据分析原理和基因芯片数据分析原理本质上相同,我们将GA/WV的方法应用到我们实验室的噬菌体展示芯片数据中,通过实验比较,我们发现GA/WV的效果要好于T检验。
其他文献
广西弄拉是典型的岩溶峰丛山区,主要的岩石是泥盆系东岗岭组泥硅质白云岩,不但富含Ca、Mg碳酸盐成分,而且Al、Fe、Si、P、K等常量元素和Mn、Zn、Cu、Co等微量元素的背景值也较高。在岩溶地球化学过程
目的检测雌激素受体β亚型(ER-β)在乳腺癌组织中的表达,探讨ER-β表达在乳腺癌组织中表达的意义及与患者预后的关系。方法选取河南科技大学第一附属医院2005年1月~2006年6月
利用Mueller矩阵,以三种典型目标为模型,全面分析了主动偏振成像系统的误差来源。在实验系统典型参数下,对偏振度误差进行了模拟。提出了利用标准偏振度目标校准系统参数的方
本文较详细地分析了湖州安泰物流中心发展中的问题,并且针对这些问题,结合企业现状,提出了解决思路和对策。
以承德市丰宁县小坝子乡5种密度(600,925,1 200,1 375,1 525株/hm~2)的杨树人工林为研究对象,对其林地的涵养水源功能进行研究。结果显示:(1)土壤容重随密度的变化大小排序为
“新常态”一词最早源于我国国家主席习近平,最早被应用于经济学领域。习近平在考察河南期间,对河南的经济状况和实际生产力发展水平提出了新的要求,指出“中国发展仍处于重
"主制造商-供应商"模式下民机研制的全球化程度越来越高,为了完成民机产品的最终总装,波音、空客需要将来自全球各地的零部件运输到相应的部段装配线,完成部段装配后还需将其
深度分析了物理习题中调和平均数的产生原因,创新地指出"比值定义法"和等差中项对调和平均数公式表现形式的重要影响,然后通过构建调和平均数模型利用调和平均数公式系统地解
随着我国教育改革工作的开展,越来越重视素质教育,并且随着高职教育的扩招,高职院校学生也在逐步增加,导致思政教育工作难度越来越大,只有制定行之有效的教学措施,才能提高高
在概述陈鹤琴“活教育”的十三条训导原则的基础上,探析了其中蕴含的德育原则、德育过程、德育方法,阐述了“活教育”训导原则对新时期学校德育工作的启示。