【摘 要】
:
测序技术发展日新月异,第二代高通量测序已成为主流技术广泛应用于各个领域,与此同时基于单分子读取的第三代测序技术也逐渐发展起来。越来越多的测序项目得以开展,随之产生
论文部分内容阅读
测序技术发展日新月异,第二代高通量测序已成为主流技术广泛应用于各个领域,与此同时基于单分子读取的第三代测序技术也逐渐发展起来。越来越多的测序项目得以开展,随之产生了大量各具特点的测序数据:第二代高通量测序精确度较高,但是测序序列读长较短;第三代测序序列读长较长,但测序误差较大。充分挖掘并科学整合两种测序序列中的生物信息资源,进一步得到生物完整的基因组注释,对转录组学的研究具有重要意义。热带爪蟾凭借自身生长周期短、胚胎发育快、染色体为二倍体等优点,发展成为基因组学、早期胚胎发育学和遗传学等领域中重要的两栖类模式物种。本文针对热带爪蟾,基于二代三代测序序列,设计了一套完整的基因组注释流程,注释流程分两部分:二代三代序列的转录组组装和基于组装结果的基因组注释。第一部分利用二代序列通量高、精确度高的优势进行了从头组装和有参考组装两种方式初步构建转录本;借助二代序列对三代序列进行校正得到全长转录本;将上述两种转录本比对到参考基因组上,获得具有更长序列的转录组。第二部分依赖从转录组中提取的开放型阅读框架构建热带爪蟾的隐马尔科夫模型,进行基因结构从头预测;比对获得热带爪蟾同源转录本;以组装获得的转录组为基础,结合基因结构从头预测结果和同源转录本,参考同源蛋白质序列等公共数据,最终整合得到热带爪蟾基因组注释。分析结果表明,本文设计的基因组注释流程有效发挥二代三代测序序列的各自优点,整合两种测序序列进行转录组组装,参考不同来源的生物数据,获得丰富准确的注释证据,完整注释出两栖类真核生物的基因组信息。与已有的注释版本相比,本文最终获得热带爪蟾基因组注释增加了基因和编码区的数量,扩充了原有基因的长度,为后续的基因组功能注释、比较基因组分析和重测序等相关研究奠定了良好的基础。
其他文献
齿轮箱是高速列车动力转向架驱动系统的关键部件,其中齿轮传动系统和箱体结构是保障齿轮箱安全运行的核心构件。在高速重载工况下,齿轮啮合的过程中总会伴随高频冲击,同时箱
本文以银川市金凤区绿地中心某超高层建筑基坑工程为依托,通过查阅、收集相关文献资料,对深基坑工程的支护结构选型、支护结构影响因素、变形机理、基坑变形监测方法和计算原
近年来斜桩在海上风电机组、近海码头和特高压输电塔架等工程基础中广泛运用。斜桩桩身轴线与地面不垂直,致使桩身侧向土压力和土体位移呈非轴对称分布,这使得斜桩的承载变形
单光子探测技术在国防军事、科学研究及民用生活等范畴具有广泛的应用前景,例如量子通信中的密钥分配、天文学中的激光测距以及医学中的荧光寿命成像等。短波红外InGaAs雪崩
随着现代电气工程的快速发展,用电装置对供电系统的要求也愈来愈高,传统供电方式难以满足用电装置在水下、地下、雨雪及存在运动等特殊工况下的用电需求,动态非接触供电技术
寄主植物-植食性昆虫的协同进化过程中,植食性昆虫生存的关键是找到合适的寄主植物来完成生活史,以柳树-柳蓝叶甲的互作系统为例,在该系统中,柳蓝叶甲是一种可以寄生于绝大部
目标检测是当前计算机视觉领域的一个研究热点,主要任务是找出图像或视频中所有感兴趣目标的位置,并给出每个目标的具体类别。近年来,目标检测在很多计算机视觉领域中已经有了很多成熟的应用,如车辆自动驾驶、图像检索、视频监控和信息采集等。基于传统图像处理和机器学习的目标检测算法通常使用手工设计的特征,并且利用小样本进行训练,这种做法常常会受到光照、遮挡和环境变化等因素的影响,最终导致目标检测的效果不佳。与传
随着我国社会经济的发展、城镇化水平提升,城市公共空间的建设日渐成为评价区域形象和区域竞争力的重要指标,得到越来越多的重视。党的十八大以来,文化自信更是被提升到国家
柱作为重要的受力构件,在结构中起到至关重要的作用。将高强混凝土置于约束状态之下能够改善混凝土柱的延性。随着建筑工业化的发展,装配式结构得到了普及和推广。迄今为止,
电动汽车在节能和环保方面的优势突出。但是,作为电动汽车动力源的蓄电池相对而言存在功率密度较低和循环寿命短的缺点,而且车辆行驶工况复杂多变,单一蓄电池的电源系统不能