基于扩增子捕获测序去除引物软件的设计

来源 :大连医科大学 | 被引量 : 0次 | 上传用户:bgydong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是由控制细胞功能的基因发生某些突变而引起的,尤其是控制细胞生长和分裂的基因发生变化。特定类型突变的检测有助于癌症诊断,诊断后也可利用突变来追踪患者对治疗的反应。基因突变检测方法有全基因组测序、全外显子组测序、杂交捕获以及扩增子捕获技术。扩增子技术是利用特异性引物对感兴趣区域进行扩增形成富集的DNA文库,该技术实验流程的简化极大的降低了操作人员的专业门槛,彻底解放人手不足的风险。和扩增子测序技术相比,全基因组和全外显子组测序费用高,杂交捕获的实验过于复杂,过多的人工干预步骤可能会给实验结果带来很多的不可控因素,这对于临床而言是非常致命和不允许的。目前,扩增子捕获技术已被证明是一个快速、有效的技术,并在新一代高通量测序中发挥独特之处,已经产生了许多令人兴奋的发现。随着多扩增子测序(Multi-Amplicon Sequence,MAS)在遗传变异检测中的广泛应用,需要一种有效的工具来去除reads的引物序列,以确保下游分析的可靠性。虽然目前有一些工具如cur Primers,cutadapt,Alientrimmer,但是它们在去除大规模的引物在高通量目标基因组测序中的效率和准确性需要提高。考虑到MAS在处理病人样本方面的潜在临床应用,这一问题变得越来越紧迫。所以我们基于C语言开发了批量处理大规模靶向测序引物的高性能软件Ptrimmer。Ptrimmer结合了k-mers和Needleman-Wunsch两种算法,可以同时处理“测穿”和“未测穿”两种情况下reads上的引物序列。k-mers模型允许引物上出现错配,哈希表提高搜索引物的速度,Needleman-Wunsch算法允许引物上出现indel。在查找的过程中先用k-mer模型查找引物,如果查找失败则切换到动态规划模型寻找最优的引物。所以,即使引物上存在测序误差和插入删除也能保证其准确性。与同类工具相比,灵敏度提高了28.59%,准确度提高了11.87%。模拟数据结果表明,与cut Primers(灵敏度为70.85%,准确度为58.73%)相比,此软件灵敏度为99.96%,准确度为97.38%。性能也明显提高,比cut Primers快370倍,甚至比单个线程的cutadapt快1.7万倍。从1100万条reads(Illumina PE 150bp)中去除2157对引物只需要37秒,内存消耗不超过100MB。我们同时开发了linux版和Windows版,方便非生信人员使用。Linux版本依赖少安装简单,用于从多重扩增子测序和目标测序中去除引物序列。与其他三种同类工具相比,具有较高的敏感性和特异性,可以帮助用户获得更可靠的突变信息,用于下游分析。
其他文献
背景:目前循证医学证实,经皮冠状动脉介入(percutaneous coronary intervention,PCI)可使急性心肌梗死(acute myocardial infarction,AMI)患者明显受益,降低患者死亡率、提高
第一部分初步探索IB4~+神经元轴突再生能力与PTEN基因表达的相关性目的:神经损伤是临床一大难题,损伤后功能恢复欠佳,致残率高。在外周神经中,能被植物凝集素(Isolectin B4,I
因应能源与环保等要求,润滑领域的绿色水基润滑剂得到越来越多的关注。虽然水基润滑符合可持续发展的要求,但它具有承载能力低和易腐蚀等缺点。因此,需要选择性能优异的添加剂以改善其润滑性能。聚醚类添加剂是水溶性聚合物基础添加剂,在大多数时候,在不同的润滑状态下均能够通过形成稳定的具有吸附和承载能力的薄层膜以改善润滑性能。本文选择两种无规则共聚醚:丙二醇无规共聚醚(propylene glycol poly
目的:本研究旨在探讨心脏手术患者术后早期的细胞因子风暴变化特征,并观察其与病情严重程度的相关性。方法:本研究纳入自2019年4月28日至2019年12月31日心脏手术术后合并多器官功能障碍,转入大连市中心医院重症医学科治疗的重症患者(重症组)。纳入标准:序贯器官衰竭(Sequential Organ Failure Assessment,SOFA)评分大于或等于10且合并2种或2种以上器官功能障碍
辽宁电网为火主电网,电源结构不合理,系统十分缺乏调峰电源,随着辽宁经济的快速发展以及用电结构的调整,未来辽宁电网负荷将迅速增加,峰谷差逐渐增大。据预测,2025年辽宁电网
消费是经济发展的目的和动力,消费观决定着人们的消费行为和消费结果。随着研究的深入显示,个体所产生的消费不仅受到对于商品和服务的客观需求影响,也受到心理需求的影响,其中由于自我感知受到威胁而产生的特殊的消费属于补偿性消费。补偿性消费潜移默化的影响着消费者们的日常消费。大学生正处于身心快速成熟阶段,是健全社会认识的重要时期,很容易被不良消费理念感染,对消费观的树立产生消极影响,这种影响不但能影响学生们
用材林是以生长迅速并能生产优良木材为目的营造的林型,日本落叶松因其生长迅速,材质重,硬度中等,耐朽力强等特点,成为了辽宁省东部地区一个主要的培育用材林树种。本研究以
现在,AA-LRT系统运行处于初始阶段。因此,大多数操作都在较低的层次上进行,例如速度,前进时间和生产线能力。但这仍然是合理的,以便熟悉该系统以获取过程中的经验并逐步发展到更高的性能水平。在铁路运营过程中拥有出色表现的最重要的决定性因素之一就是火车时刻表。有了良好的火车时刻表:火车可以更快,更频繁,更安全地运行,并为乘客提供高效服务,并充分利用可用资源。因此,专门针对新近运行的AA-LRT时间表研
[摘要]在整体医疗系统中,社区中设立的卫生服务中心是与群众最贴近的基层机构,其负责的患者数量较多,因此工作量与难度也较高。本文从社区服务中心存在的党建工作问题入手分析,主张应重点发挥党组织的引导作用,不断加强党建工作的推进力度,通过考核等手段促进党员素养的全面提升,将党建与日常工作内容相融合,从而有效推动医务工作水平不断提升,为社区群众提供优质的医疗服务。  [关键词]基层卫生院;党建;综合素质;
某集中供暖项目直埋管道泄漏风险评估研究,遵循管道风险管理相关理论,并应用一定的风险评估技术开展研究。梳理与直埋供暖管道类似的城市燃气管道、供水管道、排水管道等市政管道的风险管理文献和集中供暖项目风险管理文献,在此基础上,分析某集中供暖项目直埋管道危害事件和其它基本情况。应用故障树分析法,经整理后识别出项目直埋管道泄漏风险危害因素3个方面的清单,分别是管道设备自身因素、管道运行环境因素和管道运行管理