论文部分内容阅读
绘制基因表达调控网络是功能基因组学和系统生物学研究的核心问题之一。构建基因表达调控网络最重要的首先是鉴定基因组编码的所有转录因子蛋白以及它们在基因组中全部的DNA结合靶点(TFBS)及靶基因。目前已经在人的基因组鉴定出近3000种转录因子,而其中能够和DNA直接结合的转录因子约700多个。在这些:DNA结合转录因子中,几乎没有一个转录因子在人基因组中的全部功能性DNA结合靶点(也称为结合谱)及其靶基因得到彻底明确地描述。因此,成为构建基因表达调控网络面临的最大障碍。
为了解决这一问题,近年来已经发展了多种高通量预测及鉴定TFBS的新技术,如双链DNA微阵列芯片(dsDNA microarray)(也称为蛋白结合微阵列,PBM)、染色体免疫沉淀.芯片(ChIP-chip)、染色体免疫沉淀-测序(ChIP-seq)。另外,还出现了大量生物信息学预测技术。
目前把基于生物学实验的技术统称为湿实验(wet experiment),把基于生物信息学的技术统称为干实验(dry experiment,insilico experiment)。大量新颖的研究表明,要在全基因组范围鉴定转录因子的TFBS及靶基因,必须将干湿实验技术有机结合。为此,本论文展开了这一方面的研究。
本研究希望建立一种“湿实验→实验→湿实验”紧密结合的研究思路,快速高效鉴定一个转录因子蛋白的TFBS及靶基因,进而构建一个转录因子控制的基因表达调控网络。本研究希望通过具体的实验研究证实这一思路是可行的,是有效的。
本论文首先设计出“湿实验→干实验→湿实验”的基本思想,即首先以湿实验手段获得一个转录因子与大量人工设计DNA结合序列的结合特异性及亲合性数据,筛选出所有能够与转录因子结合的DNA序列;然后以干实验手段扫描人全基因组,定位这些序列在基因组中的分布,将它们推定为转录因子在基因组中的假定结合位点(putative binding sites,PBSs),并依据这些位点提取附近的基因,将这些基因推定为转录因子在基因组中的假定靶基因(putative targetgenes,PTGs);最后,以此为蓝图,再以湿实验手段快速验证这些假定结合位点及假定靶基因是否是转录因子的功能性(functional)结合位点及靶基因。其中第一次湿实验手段是dsDNA微阵列芯片,第二次湿实验手段主要是染色质免疫沉淀(Chromatin immuno-precipitation,CHIP)、PCR等。
其次以著名的转录因子NF-κB为研究对象,用单碱基突变dsDNA微阵列芯片研究了NF-κB对所有单碱基突变DNA序列的结合,筛选出具有较高亲合性的10个序列(GGGACTTTCC、GGGACTTCCC、GGGATITTCC、GGGAATTTCC、GGGAGTTTCC、GGGGCTTTCC、GGGTCTTTCC、GGGACTTTAC、GGGACTGTCC、GGGACTTTTC);在本论文的干实验部分,对人基因组进行了这10个序列的全基因组扫描,定位了这些序列的分布,发现这些序列在基因组中确有分布,并且大量位于已知基因附近(上游、下游、内部),因此将这些位点预测为NF-κB的假定结合位点,将与之联系的基因预测为NF-κB的假定靶基因;扫描共得到42017个靶点,其中22170个靶点10kb内有基因,被预测为PBSs,相应的预测到9869个PTGs;通过文献检索,发现在PTGs中有135个经实验研究鉴定的NF-κB靶基因。对PBSs在基因组中的分布进行统计分析,发现有11%的位点在基因5’端10kb内(其中0-1kb内1%,1-5kb内5%,5-10kb内5%),27%的位点在基因内部(其中第一内含子内10%,其他内含子内24%,外显子内3%),10%的位点在基因的3’端10kb内,42%的位点在基因10kb外;这些分布特征与ChIP-chip等实验研究取得的结果相似。对PBSs和PTGs的染色体分布分析发现,两者都有成簇分布的现象。对PTGs进行功能聚类分析,并与文献报道的确证靶基因的GO聚类分析结果进行比较,发现PTGs的33个聚类条目中,有8个条目与确证靶基因组的聚类条目重叠。干实验部分的研究为进一步大规模实验鉴定NF-κB的DNA结合靶点和靶基因提供了行动蓝图。在湿实验部分,我们挑选了具有代表性的7个靶基因(TNIP1、IL-6、HFE、MIA、RARG、STAT1、LTBP1),对其相应DNA靶点进行了湿实验分析,采用染色质免疫沉淀技术配合PCR技术验证了7个典型基因附近预测的DNA结合靶点,12个新预测DNA靶点中9个靶点与NF-κB结合,湿实验部分的研究不仅发现了新的NF-κBDNA结合靶点,同时也印证了干实验预测的可靠性。
通过这些研究,论证了本论文提出的干湿实验结合预测及鉴定转录因子DNA结合靶点和靶基因研究思路的可行性,为转录因子DNA结合靶点和靶基因的研究提供了一种新的思路。