微生物基因组数据鉴定方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:tsmcxuesheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着DNA测序技术的发展,生物信息学的基因测序数据呈现出了爆炸式的增长趋势,随着研究人员对生物基因信息研究的逐渐加深,随之出现了大量的基因组测序数据。大量的基因组测序数据为生物信息的研究提供了数据基础,但是后续的分析和处理上仍然存在挑战。对于没有经验、没有足够生物信息学技能的用户来说,通过读数分析使测序数据合理地用于微生物鉴定,尤其是细菌鉴定,仍然是一个挑战。而在过去的几十年里,真菌导致的病害引起了广泛关注。随着测序技术的发展,对真菌测序分析成为了真菌研究的一个新的方向,但是随着真菌数据的逐渐增多,现在缺乏充足功能的分析工作流。尤其是基于真菌的染色体基因组的鉴定和注释。正如人们所知的那样,历史上的许多病毒都导致了大量的普通人感染和许多感染者的死亡。除了这些会对人类产生巨大危害的病毒外,许多症状轻微的病毒也需要得到人类的关注。并且随着时间推移,病毒往往在不断的变异。在现在人类对于病毒的研究还远远不够,甚至病毒的完整基因组测序数据仍然很少,所以对病毒的鉴定和分析仍存在挑战。为了改善应用微生物基因组信息受阻于有效分析结果的生物信息学挑战的局面,本文开发了一种名为PBGI的自动化生物信息学分析工作流,利用Illumina、Pac Bio和Oxford Nanopore平台等多个平台产生的短读长或长读长测序数据进行定制化生物信息学分析。PBGI通过短读长序列或长读长序列分析进行细菌鉴定,是一种用户友好的方式,可以提供准确的分析结果。为了改善真菌方面生物信息学的发展的情况。本文介绍了一种名为M4A1的自动化生物信息学分析工作流,用于识别和注释由Illumina、Ion torrent、Pacbio等多个平台测序的短读长序列和长读长序列。M4A1可以通过一行简单的命令行执行并在适当的运行环境下快速的执行。本文还提出了基于深度学习和传统方法的结合的病毒种类鉴定方法,并在其基础上构建了一个病毒分析工作流,利用本文提出的病毒种类鉴定方法,对几种真实的和模拟的病毒测序数据进行了测试。实验结果表明,相比于传统的鉴定方法,本文提出的与深度学习结合的方法结合了两种方法在速度和准确性上优势。
其他文献
目前,电催化领域中单原子催化剂已实现原子利用率的最大化(100%),具有很高的电催化活性和稳定性。但是,这类催化剂的热处理制备过程十分复杂,使其微观局域结构难以预测,这为
政府采购制度最早在18世纪末的欧洲出现。在全球范围内,推行市场经济体制的各国政府绝大部分以政府采购制度作为基本方式。在西方发达国家中,政府采购已然有数百年的发展沿革
石油井架是钻井机械设备的主要组成部分,提供起下钻及摆放钻柱的操作高度和空间,是一种大型复杂的塔桅式金属钢架结构物。所以石油井架结构的安全稳定性能直接影响到整个钻井作业的安全与顺利进行。本文依据“石油钻机用井架承载能力检测评定方法(SY 6326-2008,SY 6442-2000和SY/T 6326-1997)”和“API Spec 4F钻井和修井井架、底座规范”标准,对JJ170/42-K型石油
教师被誉为人类灵魂的工程师、辛勤的园丁、无私奉献的红烛。面对这些赞美和敬仰,作为一名教师的我无疑是自豪的。然而,面对现实,我又是困惑的。因为,时代在变,对教师的要求
会议
社会进步一日千里,科技发展日新月异,知识更新的周期越来越短,在这样的背景下,一个只会"传道,授业,解惑"的教师,显然赶不上时代的步伐了,因此,作为一名教师必须丰富自己的知
会议
燃料电池因具有高效清洁等特点而受到了广泛的关注,但发生在燃料电池阴极的氧还原反应(ORR)因反应速率慢,催化剂成本高昂且稳定性差的原因而严重制约了燃料电池的发展。Pd基合金催化剂对氧还原反应表现出了高的催化活性,并有望取代商用Pt/C成为新型的氧还原催化剂。合金催化剂虽然具有高的催化活性,但合金元素的流失造成了其催化活性的下降,元素掺杂是提升合金催化剂催化稳定性的常用方法。本文以Pd20Ni80-
人们通常愿意把解放军战士比作"最可爱的人",把医生比作"白衣天使",把我们教师比作"人类灵魂的工程师"。当我们听到这一称谓时,感到无比骄傲和自豪,更加坚定了我们要无愧于这
会议
超支化聚酯是一类具有高度支化结构的准椭球形大分子,其表面富集大量的活性官能团,因而有利于对其结构进行进一步的功能化设计。与相同分子质量的线性聚酯相比,超支化聚酯具
乡村旅游的发展对乡村振兴起到了至关重要的作用,逐渐成为旅游产品的重要组成部分,因此乡村旅游的发展越来越多的被重视和提及。大泽山拥有良好的自然山水资源和浓郁的历史文
随着大数据和云计算等以服务为导向的计算日益普及,越来越多的Web服务由服务提供商部署在互联网上,许多Web服务的功能属性是相同或类似,但其非功能性属性(如响应时间和吞吐量