论文部分内容阅读
肺癌是目前全世界最常见的恶性肿瘤之一,是一种复杂的分子网络疾病。目前有效的治疗方法是全肺切除加辅助性化疗,因此对于肺癌的治疗最重要的是寻找有效的早期诊断和指导预后的标志物。本文分别使用差异表达分析法(differential expression analysis,DEA)和加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)方法对 coding gene 和 lncRNA 进行分析。我们使用WGCNA法构建基因表达谱矩阵并进行聚类分析,共获得47个模块,其中八个是肺腺癌风险模块,这八个模块所包含的全部基因中共有27%是差异表达基因。然后,我们分别对这八个模块和通过DEA法找到的差异表达基因(differentially expressed gene,DEG)进行 GO(gene ontology)和 KEGG 功能富集分析。我们发现通过WGCNA法可以找到差异表达分析法没有富集到的生物过程。例如,与胶原生物大分子代谢相关的生物学过程,WGCNA法精确给出了胶原分子调控的方向。在八个肺腺癌风险模块中,green模块中的DEG和lncRNA分别占整个模块所有基因的68.9%和15.4%,是这八个模块中DEG比例最高的模块。Blue模块中DEG和lncRNA分别占整个模块的8%和33.3%,是这八个模块中lncRNA含量最高的模块。Blue模块前50个高连接度基因中有16个lncRNA,greenyellow、green、darkred模块前50个高连接度基因中分别含有3个lncRNA,purple模块前50个高连接度基因中有2个lncRNA,yellow模块前50个高连接度基因中有1个lncRNA。连接度越高的基因越具有显著的生物学功能,因此lncRNA可能在肺腺癌的发生过程中起了重要的作用。Green 模块枢纽基因中 SPTBN1、SFTPC、FHL1 和 RP5-826L7.1 都参与了肺腺癌的发生过程。其中SFTPC是基因显著性(GS)值最高的基因,FHL1是模块身份(MM)值最大的基因。Greenyellow模块枢纽基因中SAMHD1通过免疫应答过程在肺腺癌中发挥作用,而枢纽基因FCER1G和NLRC4也是通过参与免疫应答过程在其它疾病中发挥功能,其中FCER1G和NLRC4分别是枢纽基因中MM值最大和GS值最大的基因,虽然还没有文献报道这两个基因参与肺腺癌的发生,但是我们有理由相信这两个基因以及每个模块中的枢纽基因可能在肺腺癌的发生过程起作用。因此,枢纽基因可能作为肺腺癌有效的早期诊断分子和指导预后的标志物。