原核生物基因识别程序ZCURVE 1.02的研发和微生物必需基因的分析

来源 :天津大学 | 被引量 : 0次 | 上传用户:coldcoffee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微生物基因组计划的蓬勃发展,越来越多的微生物完成测序,迄今为止,已经有两百多种细菌和古细菌完成测序。基因组序列测定之后,找出其中的蛋白质编码基因是进行基因组分析的第一步,在生物信息学研究中占有重要的地位。本论文的主要内容是原核生物蛋白质编码基因识别以及通过序列比对的方法确定微生物的必需基因。论文的第一部分介绍了人类基因组和模式生物基因组计划,引出了生物信息学的发展背景和主要研究内容以及主要的蛋白质编码基因识别算法和基因识别领域有待解决的问题。论文的第二部分介绍了DNA序列的Z曲线方法,这是我们分析原核生物基因组的主要工具,同时简单介绍了Z曲线方法在基因识别,基因组的isochore结构以及在细菌和古细菌复制起始位点识别等领域的应用。论文的第三部分介绍了应用Z曲线方法对细菌和古细菌的基因识别。我们应用C++语言对ZCURVE 1.0进行了重新编写,在训练Fisher系数方面做了一些调整,取得了和ZCURVE 1.0相当的识别率,同时附加预测率有了一定的下降,用C++语言重新编写的软件被定名为ZCURVE 1.02。和ZCURVE 1.0相比,ZCURVE 1.02程序运行速度提高了近一倍,可以在Linux和IRIX等不同操作系统下运行,能够更方便的和其他软件进行整合。论文的第四部分介绍了通过序列比对的方法对微生物的必需基因进行分析。必需基因数据库(DEG)经过补充,已经包含了8个物种总共2248个必需基因,我们利用Z曲线方法分析了Bacillus subtilis基因组当中必需基因和非必需基因的核苷酸分布,并且尝试通过序列比对的方法对E. coli K12基因组的必需基因进行预测,同时分析了E. coli K12基因组当中必需基因的功能分类,并且简单探讨了通过序列比对的方法确定微生物必需基因的可行性。
其他文献
近些年来,伴随着单片机技术的快速发展,嵌入式系统技术以其自身结构简单、稳定、高效等众多优点成为了当今最热门的技术之一。而μ C/OS-Ⅱ具有结构小巧、性能稳定、代码开源
摘要:高中英语学科在目前的高考制度中,所占分量不轻。我们平时所说的三加二考试就是指数学、语文、英语(或者其他一门外语)加上文科综合(思想政治、歷史、地理三科综合)或者理科综合(物理、化学、生物三科综合)。其中的数学、语文、英语三科每一科目都占150分,另外的文科综合或者理科综合占300分,总分为750分。所以,为了取得一个好的成绩,能够上一个好的大学,我们必须重视英语学科的学习。  关键词:英语学
本文通过对荣华二采区10
期刊
本研究课题通过为期两年(2011-2012)在黑龙江省七星河国家级自然保护区的实地调查,使用定点观察、GPS卫星定位、样方测量法、因子测量法、主成分分析、正态分布分析、NDVI计算以
肠道菌群对宿主的消化、免疫和抗病等功能具有重要的影响。传统的分离培养技术不能客观全面地反映肠道菌群的结构特征。本研究应用分子生物学技术对人和动物(昆虫和大熊猫)肠
随着互联网高速的发展和微电子技术的不断进步,网络处理器作为现代网络系统的核心设备,正在沿着MPSoC(多核片上系统)的方向发展。可编程多线程数据处理单元由于其高效的多任
本文利用发根农杆菌A4,R1601菌株和 ATCC15834菌株侵染高山红景天,通过对外植体的选择、外植体最适生长条件的优化、农杆菌侵染条件的优化、除菌条件的优化、毛状根生长条件的优化,建立了高山红景天的毛状根培养系统。研究表明,农杆菌A4;R1601;ATCC15834侵染高山红景天能产生毛状根,其中,ATCC15834和A4菌株侵染率高;外植体以叶片最好,发根农杆菌菌液浓度在OD600=0.4
大豆异黄酮(Isoflavones Of Soybean)是大豆体内,特别是种子中积累的一类次生代谢产物,由于它具有多种的生物学功能而倍受人们的关注.该实验从黄酮类化合物清除自由基的效果
精子蛋白17(spermprotein17,Sp17)是一种高度保守的睾丸特异性蛋白,参与精子的顶体反应,促进受精过程。人体其他正常组织和细胞极少表达Sp17。近年来发现该蛋白基因在一些恶性肿
绢蝶属(Parnassius)隶属于凤蝶科(Papilionidae)、绢蝶亚科(Parnassiinae)。它们主要分布在东洋区以及古北区,少数分布在欧洲和新北区。全球已记载的约57种,其中中国35种。迄今为止,国