论文部分内容阅读
前言:国际癌症研究机构发布的最新报告指出,肺癌仍然是最常见和致命的恶性肿瘤。通常,手术是治疗早期疾病患者的最佳选择,因为肺叶切除术后病理性I期非小细胞肺癌的五年生存率为45%至65%。但是,大约有70%的患者在疾病晚期被诊断出来,这些患者的五年生存率仅为16.38%。肺腺癌是非小细胞肺癌最常见的类型,约占病例的40%。因此,本研究的重点仅限于导致肺腺癌发生和预后不良的复杂分子机制。细胞周期失调导致细胞增殖增加,同时细胞周期调节因子的异常表达也是导致肿瘤形成的关键因素。多种靶向细胞周期的化学治疗剂已经被开发并应用,例如,顺铂是用于非特异性阻断细胞周期的最成功的抗癌药物之一。通过关注导致细胞周期调节器失调的复杂基因网络,可以开发出一种潜在的肺癌治疗策略。已经报道的先前研究中,非编码RNA,例如长非编码RNA(long non-coding RNA,lncRNA)和微小RNA(micro RNA,miRNA)广泛的参与细胞周期调节过程。此外,据报道充当竞争内源性RNA(competing endogenous RNA,ce RNA)的lncRNA可以通过吸附miRNA产生类似海绵吸附水的效果来调节癌症相关基因的表达。尽管基因组技术和分析工具迅速发展,但鉴定与细胞周期有关并最终影响肺腺癌的新型lncRNA相关ceRNA网络仍然具有挑战性。因此,本研究的目的是调查癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库的lncRNA表达谱经由复杂的生物信息学分析,以鉴定新的lncRNA和相关的生物学功能。材料与方法:首先利用肺腺癌组织表达和人群数据通过差异表达、聚类分析等多种生物信息学方法确定于肺腺癌癌症发生发展生物学过程最相关的基因聚集模块。利用perl语言、Ensembl数据库和R语言的edgeR包对TCGA数据库中肺腺癌癌组织和癌旁正常组织RNA-seq进行预处理命名及差异分析;利用差异基因的表达谱在WGCNA包中进行加权共表达网络分析得到共表达的基因模块;利用DAVID和Cytoscape的ClueGO插件对模块内的基因进行功能注释和通路富集分析探索基因参与的显著的生物学过程。其次对上一部分富集出来的与肺腺癌临床分期相关的蓝色模块中的共表达基因簇进一步进行生存分析、基因集富集分析和列线图模型预测等方法预测lncRNA RAET1K可能作为ceRNA通过对miR-135a-5p吸附作用影响CCNE1表达发挥恶性生物学作用。利用R语言中survival和nomogram包进行预后分析及列线图模型构建确认模块中枢基因对肺腺癌预后预测的能力;利用GSEA基因集富集分析根据lncRNA RAET1K表达水平进行功能富集分析得到lncRNA RAET1K相关功能;利用基因表达间的相关关系和miRcode数据库用于基于结合位点鉴定靶基因构建lncRNA RAET1K/miR-135a-5p/CCNE1的ceRNA表达网络模型。最后在体外细胞实验中对上一部分预测出的lncRNA RAET1K相关的ceRNA表达水平及生物学功能进行验证。在肺腺癌细胞系A549和H1299中构建lncRNA RAET1K过表达和阴性对照的稳转细胞系以及共转染miR-135a-5p短片段和阴性对照组为了探索lncRNA RAET1K/mi R-135a-5p/CCNE1的ceRNA调控机制。首先利用Real-time PCR和Western blot检测lncRNA RAET1K/miR-135a-5p对CCNE1表达情况的影响;其次利用荧光素酶报告基因活性报告检测lncRNA RAET1K和miR-135a-5p之间的靶向作用;最后利用细胞周期、CCK8和细胞克隆形成实验检测lncRNA RAET1K/miR-135a-5p干扰细胞周期分布和细胞增殖能力。使用SPSS 22.0统计软件进行统计分析,GraphPad Prism 8软件进行绘图分析,进行双侧检验,定义统计学显著性为P<0.05。通过Student-t检验进行两组正态分布类型的定量资料的统计学分析,方差分析进行三组或三组以上的连续型资料分析。皮尔逊相关系数用于识别相关性。生存分析根据基因表达的中位数进行分组,Kaplan-Meier法和log-rank检验进行单因素生存分析,Cox回归进行多因素生存分析。每组实验重复三次,数据用平均值±标准差表示。结果:在确定影响肺腺癌发生发展的共表达基因簇的过程中,在TCGA数据库中564例人肺腺癌组织样本数据进行交叉比对出991个在早期和晚期肺腺癌样本中均有差异的基因,利用WGCNA方法对这991基因表达谱进行共表达基因网络构建得到四个模块与肺腺癌高度相关。根据肺腺癌临床进展特征分析得到蓝色模块和棕色模块与疾病进展呈显著正向相关,进一步发现蓝色模块中的基因簇显示出基因之间强相关,利用DAVID和Cytoscape的ClueGO插件对蓝色模块中的250个基因进行功能富集分析得到显著相关的功能和通路为细胞周期。进一步对250个蓝色模块内的共表达基因,利用单因素Cox回归和Kaplan-Meier分析蓝色模块中的47个lncRNA和203个mRNA得到141个高表达的mRNA中枢基因与不良预后显著相关,其中仅有一个lncRNA为lncRNA RAET1K(HR=1.428;95%CI=1.052-1.939;P=0.022)。对临床分期,年龄,性别和lncRNA RAET1K表达水平的风险评分构建了列线图得到lncRNA RAET1K表达水平对肺腺癌患者1年和3年生存率的独立预测因素。利用GSEA的GO富集得到较高lncRNA RAET1K表达水平的肺腺癌基因表达谱富含与细胞周期生物学行为相关的基因。利用组织中的基因表达谱的相关性和靶位点结合构建lncRNA RAET1K可以充当海绵来吸收miR-135a-5p,从而调节CCNE1表达的ceRNA网络模型。最后在体外细胞实验中对lncRNA RAET1K/miR-135a-5p/CCNE1这一ceRNA的调控机制和生物学功能进行验证,结果显示在肺腺癌细胞系A549和H1299中构建lncRNA RAET1K过表达和阴性对照的稳转细胞系以及mi R-135a-5p短片段,通过Real-time PCR和Western blot结果得到lncRNA RAET1K可能通过下调miR-135a-5p表达来抑制CCNE1 m RNA和蛋白的相对表达(P<0.05)。利用萤光素酶报告基因活性检测通过萤火虫和海肾荧光值的测定,结果显示miR-135a-5p可与lnc RNA RAET1K 3’UTR区结合发挥作用。在肺腺癌细胞系A549和H1299细胞中利用细胞周期实验得到结果miR-135a-5p的抑制和lncRNA RAET1K过表达可以协同阻滞A549和H1299细胞进入G1期,并阻止细胞周期从G1转变为S期(P<0.05)。最后在A549和H1299两种肺腺癌细胞系中利用CCK8和细胞克隆形成实验得到结果miR-135a-5p的抑制和lncRNA RAET1K过表达可以协同促进A549和H1299细胞增殖能力增强(P<0.05)。结论:1.利用WGCNA方法进行肺腺癌表达谱可创建具有生物学意义的基因模块探究肺腺癌发生发展的分子机制并发掘潜在的生物标志物。2.在TCGA数据库的肺腺癌基因表达谱中高表达的lncRNA RAET1K可作为不良预后的独立预测因素,可能通过影响细胞周期发挥恶性生物学作用。3.在肺腺癌中lncRNA RAET1K作为ceRNA竞争性吸附miR-135a-5p增加CCNE1表达。4.在肺腺癌细胞中lncRNA RAET1K/miR-135a-5p/CCNE1的ceRNA表达网络模型可能通过阻滞细胞周期G1期促进肺腺癌细胞增殖。