论文部分内容阅读
基因转录调控一直是生物学研究的重要内容,实质是转录因子与其在基因组序列中对应的短的DNA序列(5-25bp)结合,调控靶基因的表达。前人实验结果显示转录因子的结合位点多分布在基因转录起始位点上游区域。因此,本研究利用生物信息学的手段,从啤酒酵母基因组中转录因子的结构、靶基因的功能、结合序列的保守性出发,研究转录因子结合位点在基因上游的分布特征。
本研究首先将啤酒酵母基因组中基因上游0-2000 bp分为长为100 bp的区间,统计基础域结构和B支架结构两种超类转录因子结合位点在不同区间的频数,并按照转录因子结构对转录因子进行聚类,分析结构差异不同的转录因子间结合位点分布的差异;再按转录因子所调节基因的不同功能,从生物过程、分子功能、细胞构建、主要功能四个层次对基因进行聚类,并分析了结合位点在不同组间的分布差异;最后本研究又综合了位置权重打分矩阵和位点保守性参量,分析了转录因子在不同区域这些参量的变化。
研究结果表明,转录因子结合位点集中分布在转录起始位点上游100-500 bp(61%);结构相似的转录因子(家族内)间结合位点的分布无显著性差异,结构差异较大的转录因子(家族以上层次)的结合位点分布差异显著(P<0.01);大多数转录因子(19/22)在不同功能基因间结合位点分布差异不显著(P>0.05),仅在分子功能层次有部分转录因子在所调控基因上游的结合位点分布有显著差异。这说明转录因子结合位点分布受转录因子的结构影响较大,与所调控基因的功能相关性较小,而与基因参与的生物过程和所在的细胞位置几乎无关。
基于转录因子结合位点序列通常比较短且保守的性质,本研究将碱基保守性参数引入矩阵模型描述转录因子结合位点的特性。分析调控基因数目最多的四个转录因子结果显示:(1)转录因子所结合的各个位点间保守性差异很大,这种差异在转录起始位点上游不同区域有不规则的变化,但某些保守性极强的位点的保守性的变化极小,受结合位置影响较弱;(2)一致性序列保守性在不同区域变化很复杂,在某些区域虽具有很高的得分,但仍没有明显的规律;(3)四个转录因子间一致性序列保守性分布有显著性差异。因此,转录因子结合位点保守性与所结合的区域相关性较小,而主要由其转录因子本身的性质,主要是由DNA结合域结构决定。
以往的研究只表明同一家族转录因子结合位点在序列上有保守性,但本研究的结果揭示了同一家族的转录因子其结合位点,在所调控的基因转录起始位点上游具有特异的分布。并且发现某些转录因子一致性序列保守性在各个区间都极高,其结构对结合位点序列的保守性要求严格。这有助于确定调控信息所在的区域,并为现有的理论预测转录因子结合位点的方法提供新的参数。