论文部分内容阅读
外膜蛋白(Outer Membrane Protein,缩写为OMP)为跨膜结构为全β链的跨膜蛋白,作为两类跨膜蛋白中的重要类型,外膜蛋白在虽然数量和多样性上低于全α螺旋跨膜蛋白,但这它们在生命体内同样发挥着不可替代的作用,作为外膜通道负责基质、离子,甚至小分子传输等生物功能,在抗生素抗性、疫苗设计以及癌症诊疗研究中都具有重要意义。因此,外膜蛋白研究是进一步洞察生命微观活动规律,探究生命机理不可或缺的一环。生物学研究表明,蛋白质结构决定其生物功能,蛋白质功能的发现通常是依赖于清晰的蛋白质结构,外膜蛋白也遵循这个规律。然而外膜蛋白的跨膜区与生物膜紧密地相连,其空间结构也受到磷脂层作用力的影响,这一特殊的生化属性决定了外膜蛋白的结构不能像水溶蛋白那样容易被生物结晶实验获取,因此,已知结构的外膜蛋白数量远远少于水溶蛋白的数量,甚至显著少于全α螺旋跨膜蛋白,这成为外膜蛋白功能研究的主要障碍。而高通量测序技术的快速发展产生了大量的外膜序列,基于计算的蛋白质结构预测手段则是填补序列和结构之间数量鸿沟的可行手段。本文研究的重点在于利用当前有限的数据,对外膜蛋白各项功能性结构进行预测,包括拓扑结构、空间结构、内部交互结构和外部交互结构,为预测外膜蛋白的整体功能奠定基础。本文在借鉴水溶蛋白结构预测方法的基础上,重点对外膜蛋白的结构特异性特征进行抽取,根据其结构特征设计和实现具有针对性的功能性结构研究,加强外膜蛋白特殊空间结构和特殊生化属性在算法中的表现,借此减小外膜蛋白样本量小对机器学习结果的负面影响,从而提高外膜蛋白功能性结构预测的精度。研究工作按下面的研究思路逐步深入进行:1)基于外膜蛋白样本进行结构特征观察和总结,并分析和比较外膜蛋白与水溶蛋白之间的生化属性差异,提取多种外膜蛋白特异性特征并量化,通过实验对比筛选出能够显著提高外膜蛋白结构预测精度的特征。2)基于外膜蛋白结构数据样本容量小的现状,比较三大主流蛋白质结构预测方法:de novo方法、同源建模方法和折叠识别方法,对于外膜蛋白结构预测问题的适用性,最终形成根据外膜蛋白的结构特异性特征进行有针对性的功能性结构预测途径。3)首次引入深度学习方法进行外膜蛋白拓扑结构预测,设计实现相应的预测工具OMPTDN提高预测精度,描述外膜蛋白区别于水溶蛋白最重要的结构特异性,不但为后续研究工作提供相应的有效特征,更是外膜蛋白功能性结构研究的基础。4)提出基于序列片段类型的外膜蛋白序列到结构比对思路,并首次引入外膜蛋白拓扑结构特征进行比对,通过强化序列到结构比对方法中外膜蛋白的结构特异性特征,并同时使用局部和全局特征优化比对过程,全局修正识别结果。设计和实现外膜蛋白折叠识别方法TMFRB(Transmembrane Fold Recogition Beta)。实验验证此方法能够高效地从已知结构蛋白库中识别与未知结构外膜蛋白序列结构相似的蛋白,为进一步进行外膜蛋白空间构象建模提供了有力支持。5)为了克服外膜蛋白已知结构模板不足带来的弊端,外膜蛋白结构建模在TMFRB提供的模板基础上,还需要更多结构性信息以提高预测精度,而外膜蛋白内部氨基酸交互提供了可信的空间构象信息。本文采用前述的外膜蛋白特异性特征设计和实现了外膜蛋白内部氨基酸交互预测方法OMPcontact(Outer Membrane Protein Contact),填补了相应工具的空白。实验结果表明,OMPcontact可以有效预测外膜蛋白内部的交互氨基酸对,预测精度显著优于水溶蛋白相应预测工具。6)预测外膜蛋白非跨膜片段上的外部结合位点,尤其是生物药物小分子的结合位点。作为外膜蛋白通道选择性的体现,外部结合作用位点能够根据空间结构中具有特定形态的结构域选择特定的离子或小分子通过其跨膜结构,实现外膜蛋白的选择性通道生物功能。我们最终实现了外膜蛋白外部交互位点预测工具OMPsite,填补了此项研究的空白。上述研究内容形成了外膜蛋白功能性结构研究的整体思路,在外膜蛋白结构特异性特征抽取和筛选,拓扑结构预测,折叠识别方法,加强空间构象信息和外膜蛋白内部和外部交互作用预测等具体研究内容中取得了实质性进展,并提供了有效的方法和工具。此研究不但为外膜蛋白各个功能性结构预测工作奠定了良好的基础,同时也为跨膜蛋白相关研究提供了全新的视角,其研究步骤和方法可直接应用于全α螺旋跨膜蛋白,有助于进一步推动跨膜蛋白整体的结构和功能研究。