基因差异表达和差异共表达分析的整合策略研究及在癌症标志物鉴定中的应用

来源 :军事科学院 | 被引量 : 0次 | 上传用户:al035258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因往往不是独立发挥作用,而是多个基因相互协调,共同参与某一生物学过程。在基因共表达网络中,表达水平相似的基因组成共表达模块,这些模块通常被描述为一组功能相关或共调控的基因子网,参与共同的生物学过程。相对于健康样本,研究人员将疾病中新建立或失去共表达现象的基因模块称为差异共表达(Differential co-expression,DC)基因模块,它们可以用来研究复杂疾病中失调的生物过程。近年来,差异共表达分析已被广泛用于探索各类疾病的发生发展机制。此外,差异表达(Differential expression,DE)可以鉴定疾病与健康状态下表达水平显著变化的基因,因此一直是在分子水平上研究人类致病基因的重要手段。尽管差异共表达基因和差异表达基因均被证实与疾病的特异调控过程相关,但目前大部分研究仍集中在分别鉴定差异共表达和差异表达基因,差异共表达和差异表达分析未能得到有效的整合,而差异共表达和差异表达基因间的潜在关联也有待更深入的研究。为了解决这个问题,我们提出了一个新颖的分析框架DC&DEmodule,该框架可以基于共表达模块整合差异共表达和差异表达分析,并同时整合多个独立的疾病/健康对照表达数据,用以识别与疾病发生发展相关的共表达基因模块,包括激活模块(肿瘤样本中上调且共表达增强)和失能模块(肿瘤样本中下调且失去共表达)。本文主要研究内容包括:(1)我们开发了一个DC-DE集成分析框架,并将该框架用于分析六组从GEO数据库下载的,包含肿瘤组织和正常对照的肝癌、胃癌和结直肠癌的微阵列(microarray)数据集。为了减少单组数据集分析可能存在的实验误差和批次效应,提供更可靠的预测,我们在分析过程中对于每种癌症分别整合了两组独立的数据集。该框架包含两个关键步骤:1)分别识别每种癌症的两个独立数据集中保守的肿瘤共表达模块和癌旁共表达模块,2)集成差异共表达和差异表达分析来识别肿瘤中激活的(肿瘤样本中上调且共表达增强)和失能的(肿瘤样本中下调且失去共表达)基因模块。(2)将该框架应用于肝癌、胃癌和结直肠癌的各两组微阵列表达谱中,我们分别鉴定到了2、5和2个激活模块以及5、5和1个失能模块,并进一步从这三种癌症的激活模块中鉴定出17、69和11个模块关键基因。这些关键基因在肿瘤样本中同时表现出表达量显著上调趋势且与同一模块内其他基因之间相关系数显著升高,被认为是潜在的癌症诊断或预后标志物。(3)在三种癌症的关键基因中,我们基于文本挖掘发现了15、35和3个已报道的预后标志物。然后,针对其他之前未报道的关键基因,我们使用Kaplan–Meier生存分析考察它们对癌症预后的影响。最终,我们发现了3个新候选预后标志物—TCEB1、RFC4和TRPC4AP,这三个基因分别与肝癌、胃癌和结肠癌的总体预后有着显著关联。(4)我们使用每种癌症的关键基因训练了随机森林分类器,分别在TCGA和GEO数据库中收集三种癌症的肿瘤/癌旁表达数据构成测试集,考察分类器对区分测试集中肿瘤和癌旁样本的准确度。最终,我们发现针对三类癌症的平均分类准确度达到95%、93%和91.5%。(5)我们对三种癌症的激活/失能模块分别基于KEGG数据库和Reactome数据库进行通路富集分析,发现了一系列重要的肿瘤相关通路。此外,为了证明集成框架的优越性能,我们分别使用独立的差异表达分析、独立的差异共表达分析和DECODE工具处理了文中使用的三种癌症microarray数据,并进行了通路富集分析。结果显示与同类方法相比,DC&DEmodule具有更高的灵敏度。综上,我们认为基于基因共表达模块研究调控系统中的基因,可以帮助研究人员在分子水平上发现一些影响人类疾病发生发展的关键因素。在本研究中,我们提出了一种新的方法,可以通过整合差异表达和差异共表达以及联合多个独立数据集的方式,从疾病和正常表达数据中鉴定功能失调的基因共表达模块。KEGG和Reactome富集分析证明,相对于只鉴定独立基因的方法(独立的差异表达、独立的差异共表达和DECODE),基于模块的分析方法具有更优越的性能。这与我们一贯的认知相符合,即基因很少独立作用,而是在生物学系统中彼此关联共同作用。因此,我们相信DC&DEmodule将为发现更多复杂疾病的关键机制和标志物提供新的见解。
其他文献
背景:附子(Aconiti Lateralis Radix Praeparata)为毛茛科乌头属植物乌头子根的加工品,有回阳救逆等功效,对心血管疾病有高效的治疗作用,同时,附子表现出较明显的神经毒性和心脏毒性,使用不当,会造成心律失常、昏迷,甚至死亡。附子中的主要毒效成分为双酯型和单酯型生物碱,由于治疗窗较窄,临床多数不良反应是由剂量使用不当引起的,所以多种剂量下附子的体内代谢物质基础值得深究。心
学位
一、研究背景蜱(Ticks)作为一个多样性丰富的种群,是明确确定为可携带病原体的专性吸血节肢动物,与蚊子一样,是全球人类及家畜疾病的主要传播媒介。斑点热群立克次体(Spotted fever group rickettsia,SFGR)作为蜱传疾病中重要的一类病原体,在世界范围内引起大量人兽共患疾病。截止目前为止,在除南极洲外的六大洲均发现有SFGR的存在,超过15种SFGR已证实可引起人类疾病,
多肽药物在疾病治疗上具有良好的应用前景,但在采用口服或静脉注射等常规方式给药时,存在易被酶降解消除、半衰期短、生物利用度低等不足。目前的主要制剂形式为需要重复给药的静脉或皮下注射,患者依从性低,使用不便,且容易对细胞组织造成伤害和引发感染,对非侵入性新型给药方式及其制剂需求迫切。肺部给药的干粉吸入剂便于携带、操作简单,患者顺应性好,且无需抛射剂、防腐剂及溶剂,递送剂量准确,特别适用于多肽药物吸入给
2020年至今,由新型冠状病毒(SARS-CoV-2)引发的新冠肺炎(COVID-19)波及全球,确诊人数持续增加,在造成人员死亡和经济损失的同时,也产生了严重的社会恐慌,已构成“国际关注的突发公共卫生事件”。SARS-CoV-2较强的传染性、突变性和致病性,以及COVID-19成熟治疗、预防手段的缺乏,给疫情防控工作带来了巨大的挑战。作为疫情防控工作的第一步,快速准确的诊断技术有利于对散发病例的
包括挥发性有机化合物(Volatile Organic Compounds,VOCs)在内的各种有毒有害物质对人类本身、人类的生产生活以及人类的生存空间都产生了严重的危害,是不容忽视的职业病危害因素。在这类有毒有害环境中,呼吸防护装备尤为重要。防毒面具可以过滤化工行业或危险品泄漏场所环境中的有毒气体,使人体免于有毒化学品的危害。GB 2890—2009《呼吸防护自吸过滤式防毒面具》中采用苯作为过滤
目前,搜救机器人广泛应用于战争、自然灾害和NBCR等的现场勘察和伤员搜救等任务中。与常见的结构化环境不同,复杂的灾后环境下的各类障碍物以及非结构化地形会对机器人的自主运动带来极大挑战。因此,提升搜救机器人在非结构地形等复杂环境下的自主导航与路径规划能力,对于提高搜救机器人的救援效率、增强未知环境下的生存能力具有重要意义。寻找一条从起点到目标点无障碍的最短或最优路径成为提升搜救机器人自主导航能力的关
核酸药物作为目前国际上重点关注的一类新型生物技术药物,具有设计方便、应用性广、特异性强、不易产生耐药等特点。核酸药物以与疾病发展进程紧密相关的mRNA等核酸序列为靶标,由于蛋白序列编码以及碱基配对特异性,核酸药物具有“治标治本”的优点和巨大的应用前景。已上市的核酸药物种类包括si RNA、反义核酸、核酸适配体,其他核酸药物还包括核酶、sa RNA等。反义核酸作为核酸药物的重要类别,开发最为成熟。反
肝细胞癌(HCC,Hepatocellular carcinoma)是原发性肝癌的主要类型,约占肝癌总数的75%。在全世界范围内,在所有恶性肿瘤中,肝癌的发病率排行第六,死亡率排行第四。根据2018年的估计,全球肝癌的发病率约为9.3/100,000,死亡率约为8.5/100,000。在我国,肝癌的发病人数和死亡人数约占全球的50%。肝癌的主要致病因素有慢性肝炎病毒感染、酗酒和非酒精性脂肪肝等。肝
小样本学习旨在仅依赖少量标注数据实现对新类别样本的高效拟合,这一研究是机器学习领域的重点课题。研究并实现高精度小样本图像分类将使得医学图像处理、无人驾驶避障、实现智能侦察等困难课题迎刃而解,同时也将为自然语言处理、小样本目标检测与跟踪、机器人与强化学习等研究提供技术支撑。然而现阶段的小样本图像分类算法普遍存在结构复杂、需要面向新任务微调、鲁棒性差等问题,为此,本文提出了基于重赋权法的原型网络模型以