细菌必需基因团簇模型及最小基因集构建

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liutaostdio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
必需基因是生物体维持基本生命活动所不可缺少的基因。近来,细菌的必需基因集已经成为微生物学、医学、基因组学、生物信息学等学科的研究热点。由于必需基因的重要性,必需基因已成为合成生物学的基础,同时必需基因能成为抗菌药物设计的潜在靶标,且有助于理解生命的最早共同祖先。本学位论文,以必需基因为研究对象,提出了必需基因团簇模型,并构建了第一个必需基因团簇数据库(Database of cluster of essential gene,CEG)。基于必需基因团簇数据库,发展了必需基因算法和软件的实现(CEG_Match),并描绘了一个细菌的最小基因集蓝图和重构了最小代谢网络。以必需基因团簇数据库的物种为参考集,计算了2186个细菌的基因适应度,并构建了第一个细菌基因适应度数据库(IFIM)。具体如下:(1)我们首次提出必需基因团簇模型来存储必需基因,而不是像已有的必需基因数据库用单个基因形式存储。并构建了第一个必需基因团簇数据库,该模型(数据库)包含同源的必需基因簇。模型以实验确定了必需基因的16个菌株(15个物种)为对象,把在这些物种中具有相同功能的基因作为一个团簇,获得了932个包含2个必需基因以上的真实必需基因团簇,以及1929个只有1个必需基因的伪团簇。与现有的以单个基因模式存储必需基因的数据库不同,必需基因团簇数据库以团簇为单位存储必需基因。这将大大方便研究人员的使用,例如:基于模型(数据库)中的每个团簇的团簇大小信息,用户可以很方便地确定一个必需基因是多细菌物种中保守还是物种特异的。该模型(数据库)还收录了每个必需基因团簇基因(蛋白)与人类的保守性结果。利用必需基因数据库的必需基因团簇大小、与人类保守性等重要信息,研究人员可以进行进化和药物设计的相关研究。(2)基于提出的必需基因团簇模型,我们发展了一个必需基因预测的K-value算法并形成软件(CEG_Match)。该软件基于基因的功能同源性而不是基于序列的同源性。因此不需要对基因进行测序,只需要通过简单的实验确定功能就能预测基因必需与否。该软件使用简单,相比BLAST的同源搜索比对方法具有更低的伪正率,同时保持不低的准确度,且在运行时间上远远低于BLAST的同源搜索。(3)理解生物体的生存适应度对完整地理解微生物遗传和有效的药物设计十分重要。目前存在的必需基因数据库都仅提供实验确定的二进制必需性数据。我们集成了必需基因团簇数据中(CEG)的细菌的实验数据,并结合理论预测数据,提出了用连续性的数值来反映基因的必需性,构建了第一个微生物基因适应度数据库。该数据库涵盖了在CEG数据库中通过由单基因敲除和转座突变实验确定的11个细菌的基因适应度、1个酵母的实验基因适应度和2186个理论预测的基因适应度数据。研究发现理论预测的基因适应度与实验的基因适应度有显著的相关性,这说明理论预测的基因适应度与实验的基因适应度一样具有可靠性。并且用户可以友好地访问和浏览基因适应度数据库中的数据。基因适应度数据库作为第一个存储微生物基因适应度资源的数据库,该数据库有助于研究人员更好地理解微生物遗传和开发抗菌药物以降低致病菌的耐药性,特别针对缺少实验确定的基因适应度的物种。(4)最后,基于必需基因团簇数据库CEG,描绘了一个细菌最小基因集蓝图和重构了最小代谢网络。最小基因集对组装最小人工细胞非常重要,尽管有一些细菌的最小基因集已经被报道出来,但是这些被发表的最小基因集只满足自复制(繁殖)系统,或者局限的引入了代谢相关基因。为了获得一个更加可靠和完整的细菌最小基因集,相比传统的确定最小基因集策略,我们有以下系统的创新:以必需基因团簇数据库为基础,从实验确定的必需基因出发,提出一个半数保留法来确定保守基因,同时引入最小代谢网络重构以补全最小基因集。最终获得一个包含315个必需基因的最小基因集,其中157个基因参与最小代谢网络,涉及431个代谢反应。我们首次获得了一个同时满足自复制(繁殖)和自维持(代谢)两种系统的最小基因集。通过最小代谢网络重构,除了确认已经发现的20个关键代谢物外,我们新确定了5个关键代谢物。此外,发现在最小代谢网络中,高必需性基因更趋向于把其涉及的代谢物分配到多个反应中,预示着细菌在一个反应遭到破坏时,能保留更多的代谢物正常进行来降低致死风险。最后,本文讨论了最小基因集的应用领域:基于最小基因集,能够扩充现有的药物靶标数据库来发展新药物以降低细菌耐药性;提出了一个半从头合成策略来帮助设计合成一个具有广泛生物学应用的底盘细胞。综上所述,本文对细菌必需基因、最小基因集的研究做了一个较全面的探索,并应用于必需基因预测、药物靶标基因发现、合成生物学等研究上。本研究取得了一定进展,但仍有一些问题需要进一步深入研究。
其他文献
结合天津地铁一号线实例,在分析轨道交通车站作为人行过街通道使用时存在的局限性及有关问题的基础上,研究提出轨道交通车站人行过街功能的适用范围,并就如何提高轨道交通车
8月24日,随着举世瞩目的第29届北京奥运会顺利落下帷幕,奥运安保工作取得了决定性胜利,中国政府兑现了承办平安奥运的庄严承诺。
读完文章,脑里留三个镜头:一个是“我”吃肥皂,一个是“猴在灶边,每道菜做完”时“我”的那些动作,最后一个,是母亲把最后一道“猪肉炖茄子”盛走后,“我”摸着黑在锅里“打
喷淋防火林带技术可以充分发挥防火林带优势,弥补不足,并有更优异的防火效果。采用自动喷淋技术可以实现林火的自动监测与扑灭。从喷淋防火林带技术的原理与系统构成出发,阐
作业是检测学生对课堂知识掌握情况的最基本途径。不少教师整日批改的作业量大,认为批改作业无非就是划一下对错、写个等级、标个日期等,仅把它当做一种固定的任务来完成,殊
教育学生的阵地,不只是学校的课堂。开辟家庭环境的教育阵地,教师与学生家长的密切配合,利用老师在学生心目之中的崇拜心理的影响,鼓励学生在家做力所能及的家务事,培养学生
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在利用激光雷达获取数据进行特征提取时,大多采用迭代计算的方法,且对阈值敏感,计算复杂度高,计算量较大.针对该问题,提出了一种通过计算相邻扫描点的斜率差进行直线段分割与
为准确掌握变齿厚渐开线齿轮包络环面蜗杆传动的宏微观啮合性能及各设计参数对啮合性能的影响,建立了传动副数学模型,推导出啮合几何学方程,研究了螺旋角、传动比、法向模数
为了发挥省市国防科工委(办)和中国和平利用军工技术协会在军民技术相互转化和军民资源互动方面的桥梁和纽带作用,营造“军民结合、寓军于民”的氛围和在不同层面推进“非公有制