论文部分内容阅读
目的:皮肤鳞状细胞癌(Cutaneous squamous cell carcinoma,CSCC)是一种角质形成细胞来源的皮肤肿瘤,约占非黑色素瘤皮肤癌的20%。长期紫外线暴露是致病的主要因素,由于人口老龄化的增加,该病的发病率也在不断上升。日光性角化病(Actinic keratoses,AK)是一种常见的角质形成细胞源性癌前病变,单个病变的AK每年进展为CSCC的概率为0.025%~16%。两种疾病在发病诱因、发病机制、遗传特性等方面有许多共同点,但目前尚无法预测哪些日光性角化病病变可能进展为皮肤鳞状细胞癌。生物信息学是利用计算机技术处理及研究生物学数据的一门交叉学科。本研究利用生物信息学工具对皮肤鳞状细胞癌及日光性角化病的高通量基因测序结果进行检索、整理、分析,分别筛选出两种疾病发病过程中的差异表达基因(Differentially expressed genes,DEGs)及共同差异表达基因,对这些基因参与的生物进程、分子功能及信号通路进行分析,探索两种疾病的共同发病机制,挖掘皮肤鳞状细胞癌发病中的潜在关键基因。为CSCC发病机制的研究、靶向药物的研发提供新的思路。方法:在NCBI数据库GEO DataSets中分别搜索Cutaneous squamous cell carcinoma及Actinic keratosis微阵列数据,筛选出GSE45164和GSE98774两组数据集。运用R语言分别对两组数据集包含的基因芯片数据进行差异表达分析,为了更直观的展现分析结果,利用在线软件绘制热图、火山图及韦恩图。运用Metascape对这些差异表达基因进行GO(Gene Ontology)分析和KEGG(Kyoto Encyclopedia of Genes and Genomes Pathway)通路分析。通过STRING数据库构建差异表达基因编码蛋白质之间的互作网络PPI(protein–protein interaction),运用Cytoscape软件的CytoNCA插件筛选出关键节点基因,MCODE插件筛选PPI网络中最重要的聚类模块,对模块中的基因进行GO分析和KEGG通路分析。结果:1、从GSE45164数据集中筛选出319个差异表达基因,其中上调161个,下调158个;从GSE98774数据集中筛选出294个差异表达基因,其中上调171个,下调123个;将两组筛选的差异表达基因取交集获得39个公共基因。2、差异表达因的GO分析及KEGG通路分析结果显示:(1)GSE45164数据集上调差异表达基因主要富集在:免疫反应、有丝分裂细胞周期相变、角质化等生物过程;蛋白酶结合等分子功能;基底外膜等细胞成分;细胞周期、嘧啶代谢等KEGG通路。下调差异表达基因主要富集在:趋化作用、神经胶质细胞发育、结缔组织发育等生物过程;线粒体的细胞外基质等分子功能;神经肌肉接头等细胞成分;细胞因子与受体相互作用的KEGG通路。(2)GSE98774数据集上调差异表达基因主要富集在:角质化、防御反应、细胞杀伤等生物过程;丝氨酸型内肽酶抑制剂活性等分子功能;中间丝细胞骨架等细胞成分;IL-17信号通路、嘧啶代谢等KEGG通路。下调差异表达基因主要富集在:肌肉系统过程、间充质迁移、调节炎症反应等生物过程;受体配体活性等分子功能;细胞外基质等细胞成分;PPAR信号通路、细胞色素P450对异生素的代谢等KEGG通路。(3)两数据集差异表达基因的公共基因主要富集在:角质化、细胞杀伤等生物过程;RAGE受体结合等分子功能;嘧啶代谢等KEGG通路。3、PPI网络和模块分析:(1)GSE45164数据集的差异表达基因编码蛋白质的PPI网络图由150个节点和347个交互线组成,具有较高拓扑评分的前10个节点分别为:CDK1、CCNB1、CCNB2、CDC20、SMC4、KIF23、UBE2C、NDC80、RRM2、MELK;GSE98774数据集的差异表达基因编码蛋白质的PPI网络图由114个节点和275个交互线组成,具有较高拓扑评分的前10个节点分别为:IVL、C3、SPRR1B、CXCL10、SPRR3、SPRR1A、RSAD2、IFIT1、OASL、PI3;20个节点中有3个节点存在于39共同基因中:RRM2、CCNB1、PI3。(2)GSE45164数据集PPI网络图评分最高的聚类模块中的基因参与的重要生物过程包括细胞分裂和p53信号通路;GSE98774数据集PPI网络图评分最高的聚类模块中的基因参与的重要生物过程为角质化过程。结论:(1)免疫反应、角质化、嘧啶代谢过程及相关基因可能导致日光性角化病向皮肤鳞状细胞癌进展;(2)p53信号通路是皮肤鳞状细胞癌发病的关键通路;(3)RRM2、CCNB1、PI3基因可能与AK向CSCC进展相关,即可能为皮肤鳞状细胞癌发病中的潜在关键基因。