结核分枝杆菌基因组重注释研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:yijiutaosheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结核病每年都对全世界人民的身体健康造成严重的危害,其中结核分枝杆菌(Mycobacterium tuberculosis)是结核病的病原菌。虽然关于结核分枝杆菌基因组学研究取得了很大的进展,在基因组公共数据库中已有结核分枝杆菌全基因组的注释信息,但随着时间的推移,越来越多新的基因功能信息被添加进数据库,这其中就可能包含当初对结核分枝杆菌进行注释时未被使用的具有序列相似性的基因。在基因组分析时,这些新添加的基因功能信息可能为一些假想的基因提供功能转移来源。同时一些原始注释中未包含的基因也可能通过与新添加的基因功能信息进行相似性比对而被发现。本文将针对以上问题,以最新的基因组公共数据库为标准,通过基因相似性比对以及基于从头预测的方法发现新基因等方法,对结核分枝杆菌基因组信息进行重新注释研究。本研究的方法可为其他物种的基因组重注释工作提供参考。本研究的主要内容为:1.以Z曲线理论方法为基础,从原始基因注释中筛选出从属于功能已知的蛋白质编码基因(第一类基因)作为正样本,并用第一类基因的随机洗牌序列生成负样本。以正负样本为训练集,通过基于五重交叉验证的Fisher模型确定假设基因(第二类基因)中非编码的部分,即原注释中错误注释的基因。2.使用Prodigal和Zcurve两款基因预测软件对结核分枝杆菌基因组进行基因预测,将基因预测结果与原始基因组注释进行对比,挑选出重叠率低的候选新基因进行Blast序列比对,应用设定的筛选参数挑选出满足条件的新基因,并为新基因添加具体的功能注释信息。3.在基因重注释过程中,需要研究人员进行手动筛选,当有大量的基因组需要重注释,尤其是从Blast结果中筛选出满足条件的新基因时,将会是一个非常繁重的工作。因此本研究还使用PHP开发了一套能够自动进行基因组重注释的Web工具,在实现重注释工具化减少人工手动筛选工作量的同时,也能大大提高基因重注释的效率。
其他文献
随着人们生活水平的提升,如今旅游行业开始迅猛发展,旅游早已经成为了人们的精神食粮.仔细观察可以发现,我国多地旅游业先后打造专属自己的品牌文化,吸引世界各地游客前来游
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊
基于脑机接口(Brain-Computer Interface)的动物机器人技术以其诸多优点在多个领域都有较好的应用前景,其中大鼠机器人在国内外有较多的研究成果。刺激器是大鼠机器人系统中
校训文化是学校发展过程中全体师生共同努力的精神载体,挖掘校训文化的内涵和育人功能,正是新时代融入大学生思想政治教育的必然要求和生动体现.弘扬校训文化精神,践行校训文
燃油的雾化是决定内燃机燃烧品质优劣的重要因素。长期以来,人们对燃油喷雾场进行了大量的研究,但由于计算机性能和测试手段的限制,这方面的研究历来偏重于雾化的几何特性和
凝汽系统是电站凝汽式汽轮机组重要的辅助设备,它起着冷源的作用。凝汽器运行的热力性能对汽轮机机组运行的安全性与经济性有着重要影响。凝汽器高真空度的工作特点使其在运
自媒体时代,多媒体快速发展与创新下自媒体的影响力逐渐增强,传统的文化产品的营销方式已经无法满足需求,文化大数据的运用逐步深入到各行业各领域,给文化产业的发展带来了新
校园文化品牌活动作为在高校人才培养过程中重要的一环,为培养全面发展的毕业生起着潜移默化的作用,对塑造高校毕业生的心理素质有着不可替代的作用.高校要积极应对大学生就