基于单细胞测序数据的胶质瘤基因标志物识别算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lzc5812286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
胶质瘤约占脑组织肿瘤的50%,其特征表现为高死亡率,然而胶质瘤基因标志物的识别仍然有待探索。肿瘤的引发因素包括多类,其中基因表达水平的扰动会直接影响机体功能。单细胞基因表达数据以单细胞为分辨率反映基因表达,有助于更深入地理解潜在的分子变化如何改变细胞行为和疾病过程。转录调控关系的扰动也会影响基因表达水平进而影响肿瘤的发生发展,然而目前很多单细胞基因表达数据的研究中没有考虑调控关系的影响。本文充分利用单细胞基因表达数据的优势,并合理融合转录调控关系,提出一个识别肿瘤基因标志物的算法框架。将该算法框架应用于胶质瘤,为胶质瘤分子机制、药物靶向治疗等提供帮助。算法框架的核心要素包括:共识基因识别、特异调控网络构建、混合聚类识别细胞类型以及肿瘤标志基因识别。首先,考虑到肿瘤恶性细胞在不同样本之间的明显差异性,本文首先通过主成分分析、细胞特异网络构建、Louvain聚类、差异基因识别等探索单个样本内恶性细胞的表达状态,然后根据各个样本之间差异基因的重叠度识别肿瘤共识基因。从基因和样本两个角度分析共识基因的趋同性,结果表明共识基因反映了不同样本间恶性细胞的共表达模式。然后,为全面分析肿瘤特性,本文将多样本合并分析并合理融合转录调控关系进行肿瘤细胞类型识别。首先根据转录因子与靶标基因之间的调控关系构建初始调控网络,然后根据共识基因、整个单细胞基因表达数据和前反馈回路结构不断增加网络特异性构建特异调控网络。接着以该特异调控网络为基础,识别调控元模块并构建特异调控表达矩阵。最后在特异调控表达矩阵中使用一种混合聚类方法识别胶质瘤的细胞类型,并对细胞类型进行基因本体和生物通路富集分析。富集分析表明细胞类型具有明显的功能性,并且细胞类型的标志基因可能与肿瘤有着密切关系。最后,本文将细胞类型的标志基因作为候选基因,提出基于肿瘤特征向量识别肿瘤标志基因方法。为分析肿瘤标志基因的可靠性,本文分析了OS和PFI两种生存数据,以肿瘤标志基因作为分类特征,使用7种二分类算法分别构建风险预后分类模型。14种风险预后分类模型均表现出较好的分类效果,其中以随机森林构建的模型表现最优。同时本文还采用相关性度量、PubMed文献以及Kaplan-Meier生存曲线进一步分析肿瘤标志基因,结果表明这些基因与胶质瘤关系密切。另外结果分析发现肿瘤标志基因中有4个基因(NDUFS5、NDUFA1、NDUFA13和NDUFB8)均属于NADH泛醌氧化还原酶亚基基因家族,这表明该基因家族可能与胶质瘤的相关性较强。实验结果表明了本文算法框架的有效性,揭示了胶质瘤恶性细胞的6种细胞类型状态,预测了20个肿瘤标志基因,对胶质瘤的病理机制和精准治疗具有重要意义。
其他文献
镁合金是现阶段最具发展潜力的轻质合金之一,具有强度高、密度小以及工艺性能好等优势,广泛应用于航空、交通、汽车、电子等各种领域。但是,镁合金抗腐蚀性能差的缺点严重制约着其优势的发展和应用。应用仅次于钢铁的铝合金具有优良的耐腐蚀性、延展性和韧性。因此采用镁合金包覆铝合金的方式,将6061铝合金板材分别包覆在AZ31B镁合金板材两侧,制备得到的铝/镁/铝对称复合板材可以有效弥补镁合金易腐蚀的缺点,从而提
非光滑优化是一类特殊的优化问题,在图像去噪、最优控制、机器学习、压缩感知等实际领域都有广泛应用,是最优化理论与方法研究领域的一个重要分支,也是国内外众多学者研究的一个热点领域.设计快速有效的数值求解方法是非光滑优化研究的核心内容之一.现有的非光滑优化方法主要集中于求解无约束或者简单约束优化问题,然而,许多实际问题往往带有较复杂的约束条件.另一方面,随着人工智能、机器学习、大数据等领域的兴起,许多非
为全面掌握城市自然和人文地理要素的现状和空间分布情况,查清楚地理现状的具体情形,科学地掌握好地理、资源、人口等之间的相互关系和内部存在的相互联系。准确掌握、科学分析资源环境的承载能力和发展潜力,为城市重大战略和规划制定、宏观政策研究、空间布局管理、自然资源资产化、灾害预警、行业调查统计等提供地理国情公共基底和服务保障,全面提高地理国情信息对政府、企业和公众的服务能力。济南市通过开展第一次城市地理国
近年来,信息技术发展迅猛,互联网走进了千家万户,也走进了每一所高校,互联网时代的到来,既给大众带来了便利也带来了很多弊端,而对思想政治教育工作者们而言,亦是带来了新的挑战。首先,从选题的背景着手,对研究该问题的目的和意义进行了阐述,总结了当前的国内外研究综述并对此进行了梳理,阐明了研究思路和方法,并指出了本选题研究的创新点和不足之处。主要通过查阅和收集相关文献资料,梳理整合了已有的研究结果和实践经
目的:本文旨在探讨参与γ-氨基丁酸(γ-aminobutyric acid,GABA)分解代谢的γ-氨基丁酸转氨酶(γ-aminobutyric acid transaminase,GABA-T)及其基因在不同发育阶段雌性大鼠生殖轴中的表达规律,以及抑制GABA-T对SD雌性大鼠初情期和繁殖性能的影响,为雌性动物生殖调控提供科学的理论依据。方法:选取不同发育阶段(幼儿期,10 d)、初情期前(21
点云处理是计算机视觉的基本问题之一,也是当下自动驾驶、数字博物馆等热门领域的关键技术。一方面,传统的基于非深度学习的点云处理方法大都存在需要手工设计特征、易受噪声数据干扰等问题。另一方面,基于深度学习的PointNet网络在点云分割、分类等应用上展现了其具有能适用多变的数据集、抗噪能力强等优点,但无法直接用于求解点云的曲率估计或是数据简化问题。针对上述情况,本文提出了基于改进PointNet的点云
随着科技发展,市场竞争日益激烈,技术复杂程度和技术融合度不断提高,企业要想在瞬息万变的市场环境中实现稳步前进、持续发展,就必须依靠创新。创新活动推进需要丰富的资源,然而企业内部资源是有限的,若仅靠内部资源,企业创新的成功率与效率均会大幅降低。现在越来越多的企业已主动从依靠内部资源创新转向通过嵌入网络来获取多样的外部资源进行创新。虽然已有研究表明网络嵌入对企业创新具有影响,但企业的嵌入行为具有多重性
随着社会生产力的不断进步,促进了社会经济的高速发展,从而激发了制造业厂商对车间生产效率形成更高的要求和期望,如何通过一个良好的车间调度方案使得能够在更短时间生产质量更好的产品成为了每个制造厂商最关心的问题,由于车间内的存在大量干扰因素会影响整个生产流程,例如设备情况、工件数量、以及车间的种类,这些因素中每一个都有可能会对排产的优化起着至关重要的作用;此外,不同企业的需求和优化目标存在一定的差异性,
制造业发展情况体现了一个国家的经济发展情况以及生产水平,一个国家的振兴需要大力发展制造业。制造业作为我国实体经济的重要组成部分其发展的好坏对我国经济的发展有着重
十九大报告提出创新是引领发展的第一动力,是建设现代化经济体系的战略支撑,我们要加快建设创新型国家。煤炭资源型城市是我国重要的能源基地,对我国的经济发展有着重要的影响,而长期以来,煤炭资源型城市都依赖煤炭资源发展经济,产业结构单一,环境污染严重,创新能力低,导致经济发展逐渐下滑。为了尽快完成经济转型,促进煤炭资源型城市的经济增长,需要以创新为新的增长动力,转换增长方式。因此,从创新入手研究其对煤炭资