基于高通量测序平台的MeDIP数据处理优化开发

来源 :东南大学 | 被引量 : 0次 | 上传用户:britney0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相对经典孟德尔遗传定律提出的表观遗传学是大量生命现象的发生基础,其可继承的表观遗传检索模式拓展了DNA的遗传信息承载量。作为表观遗传修饰的重要组成部分,参与建立、维持基因表达调控等生物过程的DNA甲基化现象研究对人类生物学与人类疾病具有重要且深远的意义。随着近期新一代高通量测序仪的发展,表观遗传信息迎来大幅增长的契机;同时使分析大型基因组全甲基化图谱成为可能。本文依托于SOLiD高通量测序平台,以人类慢性髓性白细胞细胞系K562与正常女性外周血基因组的甲基化DNA免疫沉淀测序(MeDIP-seq)数据为研究对象,通过对现有的MeDIP数据处理方法进行总结,首次采用batman与CisGenome探索适于SOLiD测序平台MeDIP-seq数据的甲基化水平分析流程;据此绘制、比较K562细胞系与正常女性外周血基因组的全基因组绝对甲基化图谱、相对甲基化图谱及各特征区域的甲基化水平;并对可能的慢性髓性白血病相关基因及其潜在的抑癌因子进行了生物信息挖掘,以有助于理解DNA甲基化状态对慢性髓性白血病的影响。   由于MeDIP实验的本身特性决定了测序信号结果与甲基化CpG位点密度之间存在相关关系,因此如何在后续分析中量化此关系对真实甲基化水平计算的影响成为MeDIP-seq数据绝对甲基化水平评估的关键步骤。作为目前唯一适用于人类全基因组MeDIP-seq数据甲基化水平分析的方法,batman采取“耦合因子”策略建立了二项式模型并辅以贝叶斯推论过程计算绝对甲基化水平:但由于batman只经Solexa的测序结果与精原细胞MeDIP实验单样本验证,因此本课题首先针对SOLiD测序数据短片段特点对batman脚本中的一些参数如平滑范围进行了调试。同时,在研究两样本相对甲基化水平时,大胆选用了针对ChIP-seq实验设计、适于单样本分析、精于DNA片段富集区域定位的搜峰运算平台CisGenome,并对CisGenome应采取的符合MeDIP-seq数据样本分布的模型与重复序列片段对其运算准确率的影响进行了验证。经后续数据分析,本文比较了两种算法平台评估DNA甲基化水平时的优劣并针对不同定位的研究目的给出适合的分析策略。   在具体数据分析中,本课题对barman全基因组甲基化谱处理结果进行了统计,观察K562细胞系与外周血基因组整体绝对甲基化水平分布区间情况,在两样本各23条染色体的11种基因组特征区域内计算不同水平甲基化区间所占比例,并特别将CpG岛的甲基化水平与全基因组及其它特征区域的甲基化水平分布进行比较;同时,本课题也通过CisGenome对两样本全基因组18种特征区域内富集的甲基化片段数与甲基化CpG岛、总CpG岛在各特征区域中的分布进行搜峰统计。两种算法的分析结果均显示CpG岛、启动子区等与基因转录相关区域的甲基化水平明显低于全基因组及其它特征区域,这符合以往文献中对基因启动子区CpG岛序列因维持基因调控过程而大部分保持低甲基化状态的研究结果,初步证明所采取的绝对甲基化水平分析策略的正确性。外周血基因组的绝对与相对甲基化谱与K562细胞系相比,整体分布趋势大体一致,但低甲基化区域所占比例略高,尤其是CpG岛的甲基化水平呈明显降低趋势;这种正常基因组与肿瘤基因组CpG岛区域的甲基化状态差异一定程度上反映了CpG岛上DNA甲基化模式的改变与癌症形成间的关系。   针对K562细胞系分离于慢性髓性白血病(CML)女患者的特点,本课题在全基因组水平上统计并得出了K562细胞系与正常女性外周血基因组基因转录起始位点附近CpG岛绝对甲基化水平差异较大的一组关键基因,以作为后续分子生物学实验验证因甲基化调控影响基因表达的白血病相关研究靶点。并特别计算了LeGenD数据库中已验证的49个白血病相关基因CpG岛序列的绝对甲基化水平分布,结果表明K562细胞系与正常女性外周血基因组两者间在急性白血病致病基因上存在CpG岛甲基化水平较低且各区间分布较为一致的现象,但也在NUP214、PITX2与ARNT这3种与急性白血病相关基因的CpG岛甲基化比较中发现较大差异。此反差很可能是源于这3种基因因受CpG岛高甲基化调控而在非所属疾病种类中导致基因沉默,因此它们的甲基化状态检测除可能应用于诊断慢性髓性白血病之外,也有可能成为急慢性白血病的分型标志。此外,我们通过CisGenome对全基因组基因转录位点附近存在甲基化片段富集现象的基因进行了注释,在K562细胞系与外周血基因组分别得到的86557与131424个基因中,只在K562细胞系基因转录位点附近发生甲基化的基因有549个,它们很有可能成为潜在的慢性髓细胞性白血病表观标志基因。而CpG岛区域包含甲基化DNA片段富集区的基因中,K562细胞系与外周血基因组中分别发现7890与8064个,K562细胞系所独有的基因有5种,其中4种已被证明属于急性白血病相关基因,而另外一种BCL6已有文献表明其参与CML起始细胞自我更新信号传导过程,因此辅以我们的分析结果其可作为CML的表观标志基因;并且与以往抑癌因子周围CpG岛高甲基化导致基因表达沉默不同,在K562细胞系中原癌基因CpG岛甲基化状态相对正常外周血基因组出现异常的分析结果一定程度上说明BCL6的高CpG岛甲基化状态可能与维持其基因表达相关。   相对于白血病相关基因,我们还对170个抑癌基因转录位点附近的甲基化CpG岛区域进行了统计。K562细胞系检出含有甲基化CpG岛的抑癌基因48个,外周血基因组检出相应基因47个;其中K562细胞系所独有的在转录位点附近CpG岛含有甲基化区域的抑癌基因有17个,GO注释显示它们大部分均参与细胞周期调控过程并具有蛋白结合功能,这些抑癌因子CpG岛的甲基化状态很有可能与慢性髓细胞性白血病的发生相关。
其他文献
漯河市人社局在做好疫情防控的同时,积极为农民工复工复产提供运输保障,将农民工安全、便捷地输送到工作岗位上.rn2020年2月21日上午,由漯河市、舞阳、临颍县人社局共同组织
期刊
传统的蒸气压缩式制冷机需要消耗大量的电能或机械能等高品位能源,其所采用的制冷剂CFC、HCFC等氟氯烃类物质对臭氧层具有显著的耗散作用,削弱了臭氧层对太阳光紫外线的阻挡作
2020年2月27日,郑州市人社局、财政局共同印发《关于做好2020年度失业保险稳岗补贴工作有关问题的通知》,给予企业真金白银的扶持.
期刊
该文主要工作如下:1.通过对双汽源联合循环的分析,建立了较为完整的数学模型.主要包括:燃气轮机子模型、余热锅炉子模型和回热系统子模型.模型的建立充分考虑到计算机分析和
近日,福州第一技师学院积极响应福建省人社厅关于鼓励全省技工院校师生“投入实习实训支持复工复产”的倡议,厚植“技能成才、技能报国”的理想信念,引导学生主动投身企业复
期刊
近日,山东省人社厅、公安厅、交通运输厅、卫生健康委、中国铁路济南局集团有限公司、中国民用航空山东安全监督管理局联合启动农民工务工畅通行活动,全力保障农民工安全畅通
期刊
为确保企业安全迅速复工复产,杞县人社局成立疫情期间企业复工复产服务专班,提供“点对点”无缝衔接服务,在抓好劳动力县外转移就业的同时,着力帮助县内企业解决好复工复产面
期刊
新密市人社局在做好疫情防控基础上,采取以“一个六、一个五、一个四”积极引导企业复工复产,确保疫情防控与复工复产工作两手抓、两不误.
期刊
运用RS-ST01C超声测试仪,对32个海底沉积物柱状样品进行了现场超声波声学测量,并作了声速剖面初步分析,结果表明,样品及其固定方法、耦合剂、t0值、生物含量、取样效果和频率
自疫情防控工作开展以来,郑州市二七区人社局始终坚持“战疫情、保民生两手抓”的工作原则,确保疫情防控不松劲、人社服务不打烊.rn一是疫情防控不间断.成立疫情防控领导小组
期刊