论文部分内容阅读
蛋白质是生命大厦的基石。全面揭示蛋白质结构与其功能的关系,使之为人类谋福,是当代生命科学及相关领域交叉学科共同追求的目标。从图形计算和信息处理的角度帮助分析和理解蛋白质结构成了近年来计算机科学领域一个新兴的研究方向。近大半个世纪以来,科学家对蛋白质分子的外在形态、内在结构及其功能机理一直在不断探索,在现代科学技术的推动下,各种理论计算与实验方法层出不穷,为蛋白质结构的空间分布研究提供了丰富的数据资源。实验表明,蛋白质功能所呈现的多样性和独特性与其空间结构密切相关,分子表面布满皱褶,内部常有形状大小不等的空穴,其几何与拓扑形态多变,对传统的图形计算与分析技术提出了新的挑战。本文将充分利用生命科学领域关于蛋白质结构的最新研究成果,通过研究复杂蛋白质结构在空间几何分布的共性问题,挖掘出单个实验技术无法直接反映的蛋白质结构规律,提升现有蛋白质结构资源的使用价值,力求为诠释蛋白质结构与功能的关系提供新的途径。本文的工作主要包括如下三个方面:第一:研究可供快速计算的多肽链特征表达方法,探索大规模数据库中蛋白质三维结构相似性的高效检索机制;第二:研究基于蛋白质四级结构的空间分布相似性自动分类方法,重点研究四级结构空间旋转对称特征的自动判定算法;第三:剖析蛋白质空间空穴分布的几何特征,设计笼型蛋白质的自动检测算法。本文主要贡献与创新:提出了一种基于多准则递归分类的新的结构相似性快速检索模型以及三种与空间方位无关的蛋白质骨架结构空间分布特征的快速计算方法,满足了对大规模结构数据库进行检索时速度与效率的综合需求。提出了一种基于旋转对称特征的蛋白质四级结构的有效分类方法,通过对常见蛋白质四级结构的循环对称、二面体对称以及正多面体对称的特征分析,实现了自动的四级结构旋转对称特征识别。为大规模结构数据中蛋白质的功能相似性比较提供了新的结构分析手段。提出了一种高效快速的笼型结构蛋白质的自动识别算法,首次实现了基于四级结构分析的笼型结构蛋白质空间特征全自动检测软件CSPro,为该类蛋白质的设计与筛选提供了可靠的几何评价工具。经大量结构数据的计算验证,表明本文所提出的方法或软件平台对蛋白质功能结构的相似性分析具有重要的参考价值,在计算机科学与生命科学交叉研究领域进行了有意义的探索。