论文部分内容阅读
新陈代谢是最基本的生命活动,代谢网络模型对分析和理解生物体的新陈代谢系统具有重要的意义。在后基因组时代,从系统水平和综合整体的角度来理解生物将成为生物学的研究重点和核心。代谢网络重构即是从综合整体的角度来对生物体的代谢网络进行构造和分析,它给我们一个深入的视角来理解特定生物体的分子机制,特别是分子生理学对应的基因信息。代谢网络重构是一个把生物系统中参与代谢活动相关的基因,蛋白质,反应和代谢物进行鉴别,分类和相互连接以形成一个网络的过程。目前的代谢网络重构,主要是利用已有的生物学知识,包括基因的信息,蛋白质的信息,酶的信息,代谢途径的信息等多源数据信息来完成的。
论文在分析现有代谢网络重构流程的基础上,设计并实现了一个基于多源数据整合的代谢网络重构系统。该系统采用自动化的流程,从生物体的DNA数据出发,全面可靠地重构出其完整的代谢网络。主要工作包括: (1)在对代谢网络的属性和各种代谢物质关系分析的基础上,设计完成了一种能够完整描述各类代谢物和代谢模型的代谢网络描述格式。 (2)通过选择和整合大量与代谢相关的公认知名数据库,设计了一个本地的代谢资源库,为代谢网络重构提供了资源支持。 (3)在对生物DNA数据特性分析的基础上,提出了一种混合分词匹配算法来对DNA中的酶进行鉴别,实验结果和分析表明,该算法具有较好的鉴别率和良好的效率。 (4)为了对重构过程中的网络可靠性进行评估,通过引入置信度的概念来描述代谢网络中的“空白”,并对空白进行了填充和验证。
最后通过对酵母菌和大肠杆菌进行的代谢网络重构,和已经发布的结果进行了比较,验证了我们系统的正确性和有效性。我们的系统是一个自动化的重构工具,具有良好的适应性和很高的效率,对于大规模基因组的代谢网络重构和深入理解生物体的新陈代谢系统具有重要的应用价值。