论文部分内容阅读
研究目的:本研究旨对芯片数据进行生物信息学分析找到与头颈鳞状细胞癌发生发展相关基因和潜在机制。研究方法:从GEO数据库下载基因表达谱GSE6791,结合Bioconductor中的Affy包和根据其注释平台通过Affy芯片探针注释文件对探针水平数据进行预处理后,用R语言中的limma包对预处理过后的表达矩阵找出明显的差异表达基因(|log FC|>1,p<0.05)。然后利用DAVID数据库对上调和下调的差异基因进行GO功能注释和KEGG通路分析它们的生物学功能和涉及的信号通路,应用在线的STRING数据库对差异基因(综合分数≥0.8)构建蛋白互作网络图,通过Cytoscape软件将其可视化,利用其MCODE插件对蛋白互作网络进行模块分析,并对不同的模块进行GO功能注释和KEGG通路分析。最后,根据network topological analysis(节点度)选取蛋白互作网络中重要的核心蛋白,然后利用TCGA数据库验证这些核心基因的表达水平是否与头颈鳞状细胞癌总的生存率有明显的相关性。研究结果:我们得到811个差异表达基因,其中有550个表达上调,261个表达下调。GO功能注释和KEGG通路分析显示这些差异基因主要富集在蛋白酶体和ECM-受体相互作用通路中。用STRING数据库将符合标准的差异基因构建成蛋白互作网络后,利用MCODE插件得出三个重要的模块,而它们主要富集在蛋白酶体和ECM-受体相互作用通路中。在蛋白互作网络中,根据节点度的大小,我们得到15个核心蛋白,而这15个蛋白大部分处于上述的模块中。另外利用TCGA头颈鳞状细胞癌数据库显示,只有4个mRNA高表达的PSMA7,ITGB4,ITGA6和APP基因与患者总的生存率有明显的负相关。研究结论:研究证实,这4个核心基因可能通过上述通路对头颈鳞状细胞癌发生发展起到重要作用,为我们进一步研究头颈鳞状细胞癌潜在的机制提供了的方向,而且这些关键基因可能成为头颈鳞状细胞癌诊断和治疗潜在的靶点。