论文部分内容阅读
一次微阵列实验可同时观测成千上万基因的表达值,得到含有丰富生物信息的高维DNA微阵列基因表达数据。通过分析这些高通量数据中基因表达数据的关联性,有助于研究未知基因的功能分类,推测基因间的相互作用关系,寻找共表达的基因类,预测基因的调控模式,根据基因间共调控或共表达关系构建基因相互作用关系网络。 论文以基因芯片表达谱数据为数据源,采用统计学中的相关性理论,研究相关基因的相互作用关系,主要开展了以下工作: 1.对照转录因子对基因的调控关系表,筛选出受转录因子调控的大肠杆菌操纵子,对筛选出的操纵子基因表达数据分别作皮尔逊相关性度量和斯皮尔曼秩相关性度量。研究结果表明,86.33%的操纵子内基因的皮尔逊相关系数在0.5-1之间分布,在p<0.01的水平上呈显著性相关;84.53%的操纵子内基因的斯皮尔曼秩相关系数分布在0.5-1之间,在p<0.01的水平上呈显著性相关。这些结果在高通量数据统计方面为操纵子预测提供了基因组信息,对操纵子的预测具有重要意义。 2.以非负矩阵因子分解算法分离的差异表达基因为研究对象,分别对在胃癌组织中有显著性上调的基因和有显著性下调的基因做相关性度量,计算基因间的关联矩阵,设立相应的阈值,将相关系数大于阈值的基因提取出来,初步构建模糊胃癌基因相互作用关系网络,并结合相关文献,对于网络中度较大的节点基因的功能及其作用机理做了详细解释说明,用网络方法直观观测胃癌发生基因的路径(pathway),为从基因水平上预防和治疗胃癌提供参考依据。