论文部分内容阅读
蛋白质-DNA相互作用是行使细胞内外功能的关键,在诸如转录和转化的调节、DNA的复制及修复,蛋白质的表达翻译等细胞过程中发挥重要作用。蛋白质-DNA相互作用位点的研究是生物信息学领域的一个重要的分支。 一般的,蛋白质-DNA相互作用位点的预测研究首先需要对相互作用表面的物化特征进行提取,比如氨基酸极性、大小以及形状等,然后根据这些特征创建算法完成预测,特征的正确选取可以提高预测结果的准确率。 本文以蛋白质晶体结构数据库(Protein Data bank, PDB)中蛋白质与DNA复合物的空间三维坐标文件为基础,整理包含116个蛋白质-DNA复合物结构的数据集,并计算每个结构中所有原子在相互作用前后溶剂可及性表面积的差值,从而定义蛋白质-DNA相互作用的位点,依据王任小等人在研究中对常见有机分子C,N,O,S,P,F,Cl,Br和I的分类方法,将复合物结构中的所有原子分为22种原子类型,统计了非相互作用位点原子和相互作用位点原子的原子类型的频数比例分布、原子类型的面积比例分布并计算了原子类型的平均面积,得到了有统计意义的新颖结果,本文通过结合蛋白质-DNA相互作用位点预测的特点,将蛋白质表面进行原子类型分类,结果表明:22种原子类型在相互作用位点和非相互作用位点出现的概率不同;同种原子类型在相互作用位点与非相互作用位点的个数和面积的分布存在显著的差异;在相互作用位点上,各种原子类型的平均面积要大于在非相互作用位点上的平均面积;这些差异的发现为基于原子水平的蛋白质和DNA相互作用位点的预测研究工作提供了可能的途径。