基因组变异的深度挖掘

来源 :中国科学院北京基因组研究所 | 被引量 : 4次 | 上传用户:luowencheng7758258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变异是遗传学的基本研究对象,而基因组变异是产生其他类型变异的基础,因此,准确有效的基因组变异检测手段是遗传学研究的前提,在很多其他研究领域中也具有重要意义。随着人类基因组全序列的测定以及随后下一代测序技术的问世,基因组变异的检测手段进入了大规模、高通量时代。通过构建文库、上机测序、比对序列、检测变异这样的一般流程,就可获得分布于全基因组的大量变异信息。与之对应,也涌现了大量的基因组变异检测技术。然而,对于广泛存在于多细胞生物基因组中的结构变异和低频变异,仍然需要开发更好的检测手段。本论文主要介绍了通过改进序列文库的构建流程并开发相应的计算方法来深度挖掘基因组结构变异和低频变异的技术研究。ditag技术是一项用低测序覆盖度序列检测大型基因组中等大小缺失的技术。用限制性内切酶消化肝癌基因组DNA并独立构建了两个配对测序文库(mate-paired library).通过SOLiD测序,共产生了3Gb(约为1×人类基因组大小)限制性配对短序列(ditags),并通过分析ditags与参考序列的异常比对结果,检测到175个中等大小的缺失。Sanger测序结果显示总体的准确率为95%。两个文库的检测结果显示了ditag测序技术良好的重现性。使用ditag检测缺失的计算流程分析四种不同品系驯养鸡的双端RRL数据,也同样成功检测到了六千余个基因组缺失,检测效率远高于配对关系分析法(read pair analysis).虚拟长序列(Pseudo-Sanger)技术是补足双端测序序列中空余的插入片段,从而得到500-600bp长序列的方法.由黑腹果蝇W1118(Drosophila melanogaster)的基因组D认构建插入长度分布为100-600bp的梯度文库并双端测序。使用AnyTag软件将所测得的6364万条短序列拼接成569万条虚拟长序列。将虚拟长序列与基因组参考序列比对,共检测到876个结构变异,包括723个缺失、122个插入或重排和31个倒位。经过实验验证,总体的检测准确度为85.7%(54/63),证明虚拟长序列可以准确的检测基因组结构变异的断点。“序列家族”(read family)分析技术是从微量组织DNA文库测序结果中分析低频变异的技术。取仅包含100个细胞的肝硬化组织样品,将其基因组DNA打断并全基因组扩增、建库和双端测序,由于总模板数远小于DNA片段断裂位置可能产生的组合数,可根据配对序列的起始位置将序列聚类成序列家族,并通过判断不少于5个成员的序列家族内部序列的一致性,得以排除测序错误对检测低频变异带来的影响。由此,我们共得到212Mb来自单分子的家族序列,并从中检测到93个低频体细胞变异。对结构变异和低频变异的检测是当今基因组学研究的热点和难点。本论文所提出的几种技术通过对实验和分析手段的创新,成功地在人类的癌细胞、肝细胞和果蝇基因组中检测到结构变异或低频变异,并且在投入成本、检测准确性等方面具有一定的优势,在遗传学、发育生物学、癌生物学、生态学及转化医学等领域有广阔的应用前景。
其他文献
鲁迅先生曾以“我不回转去”的态度表现出和传统文化断裂的现代精神 ,据此我们通过对 2 0世纪 80年代“寻根”小说与 90年代“还乡”小说中文化暧昧立场的分析与批判 ,认为对
本文采用软锰矿为氧化剂用H2SO4浸取银锰硫化精矿中的锰。通过试验找到了最佳的工艺条件为:硫酸4N,催化剂A0.4N,液固比L/S=3,软锰矿用量为银锰精矿的40%,温度90℃,时间2h。锰的浸出率
随着经济发展的全球化、市场竞争的日益激烈,我国的起重机械制造业面临着巨大的挑战。为了适应经济全球化趋势和激烈的市场竞争,提高国产起重机械的技术含量,赢得国内外市场,本文
第二次世界大战是一场全球范围内的关乎正义与邪恶、光明与黑暗的激烈较量,1945年以中、苏、美、英为首的反法西斯同盟国的胜利和德、意、日法西斯为轴心国的惨重失败而告终
随着计算机的普及、大容量存储技术的发展以及条形码等数据获取设备的广泛应用,人们在日常事务处理和科学研究中积累了大量的各种类型数据。这些历史数据背后蕴藏了对决策有重
递归在计算机科学和数学中都是一个重要的问题求解工具,许多复杂问题的求解都可以用递归算法去解决,适当的使用递归算法可以简化复杂问题。该文通过具体的实例,讨论了递归算
<正> 农副产品作为化工原料历史已经很久了。我国是世界上对农副产品进行化学加工的最早的国家之一。商朝(公元前2205年)已会用粮食酿酒,周朝(公元前1122年)已会用靛兰作天然
在开放的、全球经济一体化的信息时代,随着市场经济的不断发展,企业综合运用成本、质量、服务、速度等因素在市场中进行全方位的竞争,而成本又在企业竞争力中占据至关重要的地位
试验采用2&#215;2因子设计(日粮类型0%或1%CLA,肉鸡性别)研究日粮CLA对不同性别肉仔鸡生长性能、屠体性状和脂肪代谢相关酶的影响。结果表明:日粮中添加1%CLA可以显著增加各性别
天然气长输管道穿越河流和湿地时,受浮力、水流等影响,易造成管道上抬、水平推移、悬空和振动,甚至管线因产生巨大应力而断裂。因此。要保证天然气长输管道长期安全运行,管线稳管