重新定义大规模测序FANSe2超高精度序列比对算法

来源 :2014非编码RNA和表观遗传学研究经验交流会 | 被引量 : 0次 | 上传用户:HUANming520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大规模测序(新一代测序,Next-Generation Sequencing)近年来得到了快速发展,然而处理由此产生的海量序列成了一个难题。测序分析结果长期存在结果验证率低、假阳性假阴性多、不同仪器测出来的结果难以重现等问题,以至于Nature发表综述疾呼: "现在绝大多数基于测序的结果都不能被验证、重复、采纳或教育他人,造成了迫在眉睫的可重复性危机"。在测序仪器和实验流程早已标准化的今天,造成上述问题的问题关键在于数据分析,而且是在最基础的mapping算法上。现有几十种mapping算法都存在着精度低、稳健性差的问题,误导了所有基于其上的高级分析结果。我们研发的FANSe系列mapping算法,以精度作为首要设计目标。其reads丢失率可低至10-6以下,在各种测试中,其准确度也高于以往所有主流算法。相比于传统算法,其有显著优势:(1)稳健性好,可重复性好,可有效应对高达12%的错误率,完美兼容一二三代测序平台;(2)不同测序仪和建库试剂盒之间具备定量可重复性,而传统算法则不行;(3)基因表达、突变鉴定结果都可以用实验验证,而传统算法会产生大量的假阴性假阳性;(4)速度高于大部分传统算法,且易于跨节点大规模并行;(5)易于使用,对参数设置不甚敏感;因此,FANSe2可以给大规模测序提供高精度的基础分析,有效解决大规模测序的可验证性、可重复性问题。在此基础上,我们甚至将FANSe2及其后续分析软件模块化,部署于超算云平台上,为社会各界乃至个人提供易用、稳健、低成本的测序云计算服务,重新定义大规模测序,使测序技术更好地为公众服务。
其他文献
Cardioprotective effects of epoxyeicosatrienoic acids (EETs) toward acute myocardial ischemia-reperfusion injury have been recognized;however, the precise mecha
会议
Prolonged, unresolving inflammation is increasingly implicated in the pathogenesis of pancreatic cancer, but the critical inflammatory mediators remain largely
会议
  非编码RNA被认为在基因表达调控与多种人类疾病的发生发展中起到重要作用,但目前人们对多种类型的非编码RNA之间的调控网络知之甚少.我们开发了starBase v2.0 (http://sta
会议
  肝细胞性肝癌(HCC)是肝脏最常见的恶性肿瘤,占世界范围内癌症相关死亡的第三位。由于利用现有的肝癌诊断方法大多数肝癌患者被确诊时已为晚期,导致其5年生存率低至10%-15%,所
会议
  在高等真核生物中,CTCF是一种结构高度保守、功能多样,拥有十一个锌指DNA结合结构域的染色质绝缘子结合蛋白.CTCF在基因活化与沉默、绝缘功能、基因组印记、X-染色体失活
会议
Guard cells as a unique single cell-type can integrate and handle multiple complex signals of environment stimulating,leading to stomata at the appropriate open
Argonaute蛋白家族可分为AGO和PIWI两个亚家族成员,它们在物种间高度保守,并在小分子非编码RNA调控途径中发挥核心作用.其中AGO蛋白家族成员特异性地与small interfering RNA
会议
  RNA 6-甲基腺嘌呤(m6A)修饰形成和维持机制及其调控mRNA加工代谢已成为RNA生物学研究前沿新热点.m6A是mRNA主要的甲基化修饰形式,其甲基转移酶(Reader-编码器)三聚体METT
会议
  非编码RNA是一种普遍存在的调控和结构分子,在细胞的生物学功能中起着极其重大的作用。通过高通量的分析和系统的筛选,我们发现microRNA-302-367簇可以显著的提高重编程
会议
MeRIP是一种研究含有甲基化修饰RNA序列的方法,其主要原理是利用甲基化修饰的特异性抗体对含有甲基化修饰的RNA序列进行富集,并通过高通量测序和结合生物信息学方法对所富集
会议