论文部分内容阅读
90%以上的头颈肿瘤为头颈鳞状细胞癌。全球每年约有50多万新发的头颈鳞状细胞癌患者,而每年因头颈鳞状细胞癌死亡的患者有20万左右[1,2]。其中头颈鳞状细胞癌的治疗方式以手术治疗为主,辅以放疗、化疗及分子靶向治疗等[3]。尽管许多的治疗手段在不断的更新和进步,但是头颈鳞状细胞癌患者五年的总生存率并没有得到明显的改善,维持在50%左右。患者如果出现病灶的远处转移,那五年生存率则下降至20%左右[4],严重危害人类的健康和生命。因此,本文利用生物信息学数据库对头颈鳞状细胞癌中基因从分子水平进行研究,为了解头颈鳞状细胞癌的发病机制和临床预防和抑制头颈鳞状细胞癌提供有效措施和方法。生物信息学是一个涉及多个领域的交叉学科,其核心内容之一是研究基因表达调控的内在机制,揭示人类疾病的本质规律,为更快速、准确的诊断和有效治疗疾病创造条件。本研究旨在对基因芯片数据进行生物信息学分析找到与头颈鳞状细胞癌发生发展相关的差异基因和其功能。首先我们从GEO(Gene Expression Omnibus)数据库下载基因表达谱GSE6791[5],其包括42个头颈鳞状细胞癌和与正常的癌旁组织。与正常组织相比,结合Bioconductor中的Affy包和根据其注释平台通过Affy芯片探针注释文件对探针水平数据进行预处理后,用R语言中的limma包对预处理过后的表达矩阵进行差异基因寻找(|logFC|>l,p<0.05)。然后用DAVID数据库对上调和下调的差异基因进行GO功能注释和KEGG通路分析差异基因的生物学功能和涉及的信号通路,然后应用STRING数据库对差异基因(综合分数≥0.8)构建蛋白互作网络图,通过Cytoscape软件将其可视化,利用MCODE插件对蛋白互作网络进行模块分析,并对不同的模块进行GO功能注释和KEGG通路分析。最后,根据网络拓扑分析(节点度)选取蛋白互作网络中重要的核心蛋白,通过TCGA数据库验证这些核心基因的表达水平是否与头颈鳞状细胞癌生存预后有明显的相关性。通过上述方法,我们得到811个差异基因,其中有550个是表达上调的,而261个表达下调。GO功能注释和KEGG通路分析显示这些差异基因主要富集在蛋白酶体和ECM-受体相互作用通路中。用STRING数据库将符合标准的差异基因构建成蛋白互作网络后,利用MCODE插件得出三个重要的模块,而它们主要富集在蛋白酶体和ECM-受体相互作用通路中。在蛋白互作网络中,根据节点度的大小,我们得到15个核心蛋白,而这15个核心蛋白大部分处于上述的模块中。另外利用TCGA头颈鳞状细胞癌数据库显示,4个mRNA高表达的核心基因与患者总的生存率有明显的负相关性,如PSMA7,ITGB4,ITGA6和APP。以上研究表明,这4个核心基因可能通过上述通路对头颈鳞状细胞癌发生发展起到重要作用,为我们进一步研究头颈鳞状细胞癌潜在的机制提供了的方向,而且这些核心基因也可能成为头颈鳞状细胞癌诊断和治疗潜在的靶点,当然我们仍然需要通过进一步的实验研究来验证我们的结论。