基于高通量测序的个体化G四联体检测方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:huyuszsz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
G四联体是一种非经典型核酸二级结构,由富含鸟嘌呤的序列折叠而成。已有多种方法,包括生物物理、生物化学、计算方法和测序技术,对G四联体的结构和在基因组中的分布进行表征和定位。本课题组前期基于G四联体的存在会阻碍DNA聚合酶的前进,进而导致G四联体测序下游区域的碱基质量值呈现下降趋势的特性,建立了一套基于数据质控在全基因组范围内检测G四联体的流程。该检测流程对低质量值区域进行遍历,并结合G四联体的序列特征,获得全基因组范围内G四联体的分布情况。但是该研究在计算低质量值的时候,没有考虑完整的G四联体序列对结果的影响,粗略地使用了每个位点所有覆盖reads进行分析。本课题在充分考虑reads上G四联体序列的完整性的基础上,对reads和具有形成G四联体潜力的序列进行筛选,建立了全基因组经典型G四联体的检测流程,并分析了单核苷酸突变对G四联体的影响,对筛选的个体化G四联体序列,开展了个体化G四联体与转录的关联性。本课题分为以下三个部分:1.构建全基因组经典型G四联体检测流程首先,使用g4predict软件基于hg19人参考基因组预测具有形成G四联体潜力的序列(potential quadruplex,PQ),共得到356,298个PQ。其次,基于包含整条PQ并且测序深度达到5以上的标准,对PQ区域的测序reads进行筛选,根据筛选后的有效reads计算PQ区域每个位点的中位质量值,进而获得低质量值区域。最后,滤除受其他结构(i-motif,poly A/T等)影响的低质量值区域后,获得能形成经典型G四联体的PQ区域。基于此流程筛选后剩余341,103个PQ,分析后共得到162,119个形成低质量值的区域,滤除47,046个发现其他结构的低质量区域后,得到能够形成经典型G四联体(detected PQ,d PQ)的共115,073个,约占分析的PQ总量的39.13%。2.全基因组个体化G四联体检测与分析基于GM12878的单核苷酸突变(SNV)信息,对该样本基因组内受SNV影响的G四联体进行检测和分析,获得GM12878细胞系样本的个体化G四联体信息。首先,基于GM12878样本的纯合突变修正参考基因组并重新预测PQ,共得到356,690个PQ,比修正前增加了2,264个,减少了1,872个。其次,基于前文构建的经典型G四联体检测流程,共获得1,155个受纯合SNV影响的个体化G四联体,约占受SNV影响新增PQ总数的54.97%。最后,分析杂合SNV对G四联体形成的影响,在碱基型1序列检测到的4,381个d PQ中有1,947个在碱基型2序列中检测不;碱基型2序列中检测的3,551个d PQ中也有1,117个在碱基型1中检测不到。不同碱基型形成G四联体潜力的差异性,充分证实了部分SNV突变会影响G四联体结构的形成。3.个体化G四联体与转录数据关联性分析为了分析个体化G四联体的存在是否会影响转录调控,使用上述检测流程对K562样本进行分析,并与GM12878中的个体化G四联体进行比较,在GM12878和K562中分别找到226和269个个体化G四联体。对个体化G四联体在基因组中的区域进行分析后发现,共有34个个体化G四联体坐落在外显子区、启动子区域或转录起始区。采用实时荧光定量PCR及转录组测序对两个样本中个体化G四联体所在转录本进行检测,结果显示,包含个体化G四联体的转录本发生差异表达的概率比转录本发生差异表达的平均概率高约1倍,表明个体化G四联体在转录过程中发挥重要作用。对不同样本进行个体化G四联体分析,对于研究G四联体在个体基因组中的转录调控具有重要的价值和意义。
其他文献
硅水凝胶是一种将有机硅链段引入到水凝胶基质中形成的聚合物网络,一般由有机硅单体与亲水性单体共聚而成。硅水凝胶材料结合了有机硅材料高透氧性和水凝胶材料高亲水性等优点,具有良好的透氧性、亲水性和生物相容性,被广泛应用于生物医学领域。聚二甲基硅氧烷(PDMS)具有高达600 Barrer的透氧值、优异的生物相容性和良好的性机械性能。将含有PDMS链段的有机硅大单体与亲水性单体共聚,是制备高透氧硅水凝胶材
自18世纪工业革命以来,世界性的社会生产力得到了飞速地发展,与此同时,城市化进程进一步提升,城市已成为人类生活的主要场所。然而在城市化进程中也产生了一系列问题:全球大气环境整体变暖、能源损耗严重、绿色自然环境遭到不同程度的破坏、城市区域出现热岛效应等。伴随着20世纪60年代产生的石油危机、计算机数据模拟技术的日趋完善,参数化设计应运而生,人们越来越重视可持续发展理念与绿色城市设计,以期营造舒适的生
学位
本文依托江阴长江大桥养护工程,针对铺装结构易产生裂缝类和车辙病害的问题,提出橡胶沥青SMA-13铺装上层+橡胶环氧沥青AC-10铺装下层的结构方式,为国内同类型特大跨径公路钢桥的铺装工程养护提供技术支持。首先,调研分析铺装上层SMA-13与铺装下层AC-10的级配范围,通过标准马歇尔试验方法确定SMA-13与AC-10的最佳油石比分别为6.17%和6.54%。接着研究环氧树脂(及其固化剂)掺量对A
随着移动机器人技术和力反馈技术的发展,带有力觉反馈的移动机器人遥操作系统成为国内外科研人员研究的热点。带有力反馈的人机接口可以为操作者提供机器人的状态和环境信息,提高远程操作的临场感。本文使用双边遥操作系统的架构,设计了基于力反馈及虚拟现实的移动机器人训练及控制系统。首先提出了搭载有小型四自由度机械臂的轮腿复合式移动机器人的设计方法,用作力反馈遥操作的从端控制对象。对机器人本体和机械臂分别进行了运
民国居住建筑体现了所处时代的技术特征和文化特征,蕴含了一定的历史价值。由于时代背景不同,建筑的建造技术与使用功能需求有别,民国时期的居住建筑较之现代住宅在空间建构层面有较大差异。受空间建构特征的影响,自然通风工况下室内气流分布较为复杂。本文以南京碑亭巷110号历史建筑为例,基于民国居住建筑空间建构特征,总结室内自然通风状况与空间建构特征的关系,针对研究对象的现状条件,提出自然通风的优化策略。研究首
共同富裕不是“均平富”,更不是“大锅饭”,而是在经济增长、金融稳定的大前提下,通过增加财富总量、引导财富向善、优化人民财富管理结构、面向普通人提供更多财富保值增值的渠道等方式,实现健康、稳定、可持续的人民生活向好。从财富管理角度支持共同富裕工作,重点方向是为人民美好生活提供更多金融支持,一方面是要为社会大众提供更加稳健、优质、可持续的财产性收入;另一方面是加强金融普惠工作的专业度、提升服务质量、扩
在双一流高校建设的背景之下,随着高等学校积极推进“院办校”,二级学院作为执行教学、科研、社会服务等职能的直接单位,在寻求内涵式发展的过程中同时也面临着优化转型,不断完善治理结构的需要。如何在二级学院层面合理科学地配置和运行权力,建立具有中国特色的,由各方利益主体共同参与的治理格局,是兼具理论和实践意义的问题。本文从高校二级学院内部治理结构入手,运用文献法、比较研究法和案例研究法,梳理了高校二级学院
自改革开放以来,我国食品安全监管体制改革大致经历了混合过渡体制、全面外部监督体制、科学监管体制、治理现代化四个阶段。2013年,我国在区级层面上试点推进新的食品监管体制改革,原工商、质监、食药监三个部门合并为市场监管部门,这一改革为系统加强生产、流通、餐饮环节的食品安全监管工作提供了良好契机,区级食品安全监管也开始由分段监管向统一监管发展。江宁区在食品安全监管体制改革后,充分发挥机构合并、职能整合
扩频信号因低峰均比、截获困难等特点在水声通信中应用广泛,非合作条件下水声通信扩频信号的截获与辨识是水声信号处理的热点与难点。随着混沌扩频技术的发展,水声通信混沌扩频信号的截获处理难度更大。本文针对水声通信的特点,对非合作条件下水声通信混沌扩频信号的辨识与参数估计方法开展研究,具体工作如下:(1)提出了基于最大Lyapunov指数的水声通信混沌扩频信号辨识方法。采用C-C方法计算相空间重构参数,在重