人脑胶质瘤蛋白质组学结合转录组学数据分析及数据库系统建设

来源 :北京协和医学院中国医学科学院 北京协和医学院 中国医学科学院 清华大学医学部 | 被引量 : 0次 | 上传用户:wra207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
胶质瘤是成年人最常见的恶性颅脑肿瘤,分为星型胶质细胞瘤、少突胶质细胞瘤和混合型细胞瘤,病理分级为Ⅰ~Ⅳ级,其中Ⅳ级的胶质母细胞瘤是最常见且恶性程度最高的胶质瘤。传统上胶质瘤的诊断主要是基于其组织学鉴定,但是对于胶质瘤分子特征的研究有望为研究胶质瘤的恶性机制提供新的思路。随着高通量技术的发展,基因组、转录组和蛋白质组等组学方法逐渐被应用于胶质瘤的分子机制研究中。蛋白质组学分析通过研究大多数生物过程的直接作用者蛋白质,来研究生物学功能。技术的发展与研究的深入,越来越多的蛋白质组学数据随之产生。因此,迫切需要研发相应的技术平台,对数据进行有效的管理、存储、注释、分析及可视化。本论文主要分为两部分工作:一,对人脑胶质瘤蛋白质组学质谱数据进行生物信息学分析并结合来自TCGA的转录组数据进一步探索与星型胶质细胞瘤发生发展相关的分子机制;二,建设了一个人类胶质瘤蛋白质组学数据库系统,可实现对胶质瘤蛋白质组数据标准化的管理、检索、可视化和实时的生物信息学数据分析。在第一部分研究中,我们重点研究了胶质母细胞瘤GBM(Ⅳ级)和低级别星型细胞瘤LGA(Ⅱ级)之间的分子差异,以发现与肿瘤恶性程度相关的分子及其机制。我们通过蛋白质组学iTRAQ标记定量质谱实验得到LGA样本和GBM样本的蛋白质表达相对定量值,将数据进行差异性分析,再运用基因本体富集分析与通路富集分析得到相关功能的本体术语和相关的通路。结合TCGA数据库中LGA和GBM的RNA-seq数据,利用转录组与蛋白质组结合的策略,进一步确定胶质瘤发展相关的关键基因,为研究胶质瘤发展相关重要基因和标志物提供有价值的线索。结果显示在蛋白质组实验中共鉴定出3226个蛋白质,其中有42个蛋白在两种样本内表达存在显著差异,GBM样本中上调表达的蛋白有22个,下调的有20个。在转录本数据中,发现差异表达基因1002个,其中上调表达的编码蛋白基因456个,下调表达的编码蛋白基因546个。将两组学结果进行交集分析,发现蛋白质组学与转录组学可得到13个共同的交集差异因子。结论:可促进免疫反应的BST2、HLA-DRB1和PSMB9在本研究中上调表达,与髓鞘形成相关的SEZ6L、PLP1、ERMN和MOG在本研究中下调表达,推测胶质瘤的恶性进展可能增强免疫反应,影响髓鞘的生理功能。本研究为后续的研究提供了新思路,为疾病的早期诊断与治疗提供了支持。为了进行临床研究蛋白质组学数据有效管理和重利用,我们建设了人类胶质瘤蛋白质组数据库系统(Human Glioma Proteome Database System,hgPDS,http://hgPDS.bmicc.cn)。hgPDS可对蛋白质组学数据进行标准化的管理、检索、可视化和实时的生物信息学数据分析。为了实现对人类胶质瘤蛋白质组学元数据和实验数据的有效管理,我们首先制定针对于本系统的元数据标准和术语标准。样本与实验元数据标准分别参考蛋白质组学最小信息标准MIAPE与PSI-MS可控词表,临床元数据术语标准化使用国家癌症研究词库NCIT。然后基于此数据标准制定了数据模型,可对多来源数据进行管理,包括临床元数据、实验元数据、实验数据、注释数据四个部分。系统基于Bootstrap、Java、MySQL等技术开发,实现了对以上数据进行有效地存储、检索与可视化。在线分析功能使用R语言实现,可以在线进行差异蛋白筛选,实时进行聚类热图分析、基因本体分析和通路分析,发现分子重要的生物学意义。综上,hgPDS实现了对脑胶质瘤蛋白质组学数据的标准化、高效管理、注释、可视化及生物信息学数据等功能,帮助科研人员进行简单高效的自动化数据分析,简化人工操作,提高科研效率。整个系统具有简捷实用、易于查询和访问、可扩展性好以及便于维护等特点。本研究首先对GBM和LGA之间进行蛋白组与转录组的整合研究,识别了与胶质瘤恶性机制密切关联的13个基因,发现上调基因中有3个基因参与免疫应答反应,下调基因中4个基因影响神经元髓鞘的生长发育。在此基础上对人类胶质瘤蛋白质组数据库系统的建设,提供了数据的标准化存储,并提供了目标数据检索和蛋白质组生物信息分析的工具。
其他文献
内皮细胞的迁移和取向排列在血管生理、病理活动中扮演极为重要的角色。临床外科手术后的伤口愈合、内皮损伤区的再内皮细胞化及植入体在植入宿主后的微循环血管新生,都伴随
泰山区现有5个街道、64个社区,辖区人口46万,社区党员25100余名。近年来,这个区适应城市党员教育管理面临的新形势,创新工作思路,创新工作方式,创新工作载体,通过加强城市党
Y-氨基丁酸(GABA)和谷氨酸(Glu)分别为大脑中枢神经系统中重要的抑制性和兴奋性神经递质,主要作用于GABA能神经系统和谷氨酸能神经系统。二者共同作用,调控兴奋传导、情感和
Nowadays, to improve English leing capability, an increasing number of Chinese students choose to study abroad. As a member of Intational students, I have a puz
在我国的医学院校中,可供学生临床训练的对象可以分为真实病人、标准病人和模拟病人三个阶段。目前“真实病人”因为病人维权意识的提高而越来越少,导致影响临床技能的培训;
microRNAs(miRNAs)是一类内源性非编码RNA分子,长度为19~23nt。近年来发现它与多种生命活动密切相关,并且在疾病的发生发展过程中起着重要的作用。miRNA本身并不编码蛋白质,
转子ⅡF型混凝土喷射机是矿山井巷广泛使用的一种体积小、重量轻,移动灵活、操作维护方便高效率的锚喷机械。但它也存在着回弹物多、粉尘浓度大、作业环境恶劣,尤其是橡胶结合
随着实验技术和信息技术的发展,产生了海量的人体生理功能实验数据。在积累生物数据的同时,也累积了大量的非结构化的生物医学文献数据,而且这些非结构化的文本数据正呈指数
所谓变更地籍调查,也就是调查人员在接受变更土地登记或者设定土地登记申请文件后,对宗地的权属状况以及界址所进行的相关调查。通过调查,查清宗地发生变更的合法性,以及变更后的
针对大学英语课堂教学中出现的突出问题,将“分享·家”的理念融入教学中,旨在建立良好的情感基础和营造良好的学习氛围;以主题演讲为主要课堂教学活动,激发学生学习兴趣,增