基于基因表达谱的结直肠癌的判别与分型

来源 :南方医科大学 | 被引量 : 1次 | 上传用户:rsy19931015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于基因表达谱的癌症判别指针对基因表达谱数据集,设计有效的分类算法,把正常样本和癌症样本分开,并找出癌症的判别基因(特征基因);基于基因表达谱的癌症分型指针对基因表达谱数据集,设计有效的分类算法,将癌症样本分为多个亚型,并找出判别各个亚型的特征基因,以利于确定药物靶向和对患者的精准治疗。然而,基因表达谱数据集的四大显著特征:“维数灾难、高冗余、高噪声、数据不平衡性”,形成了基于基因表达谱的癌症判别与分型的困难。本研究针对基因表达谱数据集的上述特征,以及结直肠癌亚型的数量未知的问题,研究了前沿水平的相关算法,以此为基础,提出了更合理的结直肠癌的判别与分型的方法,提高了结直肠癌判别与分型的准确性并找出了一系列具有高判别能力的特征基因集。本文分为四部分,第一章为绪论;第二章,研究了基于基因表达谱的结直肠癌的判别与分型的相关算法,主要包括:(1)基于RUSBoost的不平衡数据集的分类算法,将该二分类算法扩展为多分类算法,命名为 RUSBoost.M2,(2)基于差分进化(Differential Evolution,DE)和轮盘搜索策略的特征基因选择算法DEFSw,并针对基因表达谱数据的样本不平衡性,将该算法所封装的分类评估测度和分类算法分别改进为权重精度和RUSBoost.M2算法,提出了 DEFSw.wAcc及DEFSw.RUSBoost.M2.wAcc算法,提升了所选出的特征基因的分类判别能力,(3)将用于视频监控处理的BRPCA(Bayesian Robust Prince Component Analysis)算法作适当改进,引入到基因表达谱数据的处理,用于降维与降噪,(4)基于平面极大过滤图(Planar Maximally Filtered Graph)的层次信息聚类算法(简称DBHT),重点研究了其聚类的原理,利用该算法能自动确定类数并无监督地完成聚类的特点来分型;第三章,针对结直肠癌的判别,利用第二章所提出的DEFSw.RUSBoost.M2.wAcc特征选择算法,从TCGA COAD(结肠癌)数据集中选择并经在GEO GSE39582、GSE41657和TCGA READ(直肠癌)数据集上验证,筛选出13组只包含1个基因和88组包含2个基因、既可高精度地判别结肠癌也可高精度地判别直肠癌的特征基因集合,以及14组只包含1个基因、只可高精度地判别结肠癌的特征基因集合,一些基因之前并无癌症或结直肠癌的相关报道。同时,对于5个已报道的有前景的结直肠癌生物标志物,均为其找出了多个辅助基因,能显著地提高这些生物标志物对结肠癌的判别能力。第四章,利用TCGA COAD数据集,先利用第二章所改进的BRPCA算法进行基因表达谱数据的降维和降噪,再利用DBHT算法对BRPCA算法分离出的稀疏成分S进行无监督聚类,以正常样本被正确聚类为参照物,将结肠癌症分为7个亚型,然后利用DEFSw.wAcc算法选出了分型的44个特征基因,其中包含基因MSH6,其是一个已知的和结直肠癌遗传相关的基因,直接存在于KEGG的结直肠癌的通路中。
其他文献
乳腺癌是女性最常见的恶性肿瘤。国内统计资料显示,近年来乳腺癌的发病率呈上升趋势,占恶性肿瘤的7%~10%,已成为我国女性发病最高的恶性肿瘤之一。乳腺癌患者非常容易产生负性情绪,因为乳腺癌患者往往在诊断及治疗的过程中承受精神上和身体上的双重压力。焦虑和抑郁是乳腺癌改良根治术后患者常见的心理状态,对于患者身体恢复和疾病临床治疗过程具有负性影响。本研究通过对本院40例乳腺癌改良根治术后患者进行护理干预,
安徽国投新集能源公司刘庄煤矿职工发明创造的锚索牵引与切割自动操作平台荣获国家实用新型专利。锚索牵扯引与切割自动操作平台可实现锚索拉、且一键式操作,不仅减轻了职工的
目的:探讨环指蛋白113A(RNF113A)基因参与食管癌细胞凋亡、增殖、迁移、侵袭等生物学行为的影响及在食管癌中的作用;通过分析哈族食管鳞癌组织中RNF113A表达水平与食管癌临床
“张氏昆仲,敝晚学生也。年少性慧,喜书法。特函介晋谒崇阶,望有以启导,如何?如何?即候曲斋四兄。弟庸斋顿首。”1961年底,我与家兄涛光一起,手持朱庸斋先生的这封介绍函,叩
作为交叉学科,生物医学工程领域所研究的问题较为复杂,结构功能单一的材料往往无法满足研究者的需求。同时研究者们也发现将多种具有不同性质的材料进行复合,往往能为材料赋
中医是我国历史长河中流传下来的医学,其发展创新传承都对我国国民生活、传统文化发展等有着重要的作用。随着时代节奏的加快,中医传统的调理方式已经不再适应人们的要求,再
目的:观察中医护理干预对老年高血压病患者便秘的临床效果。方法:选取116例老年高血压便秘患者,排除继发性高血压、胃肠道器质性病变及相关手术病史,随机分为观察组和对照组
目的:探讨前列腺癌阴茎头转移的发病机制及诊疗预后。方法:回顾性分析1例前列腺癌伴阴茎转移患者的临床资料:患者71岁,因排尿困难在外院行经尿道前列腺电切术(TURP),术后病理
膝关节是关节化脓性感染好发的部位之一,其中最常见的致病菌是金黄色葡萄球菌,其中耐甲氧西林金黄色葡萄球菌(MRSA)是引起全球性医院内感染的重要致病菌之一。膝关节是下肢活动
大多数学生都会觉得学习是枯燥的,在学习中真正地把知识完全理解,完全明白,就要对学习产生浓厚的兴趣,只有在学生自己学习兴趣的驱动下,学生在学习过程中才能够全力以赴.俗话