论文部分内容阅读
研究目的肾透明细胞癌(Clear cell renal cell carcinoma,cc RCC)是一种泌尿系统恶性肿瘤,当前传统的患者预后模型存在一定的局限性,如TNM分期法、单组学预后模型等。本研究整合cc RCC患者全转录组学、表观遗传组学和功能性基因集数据等多组学数据,通过临床生物信息学的分析方法,筛选与cc RCC患者生存预后显著相关的多维度组学生物标志物,构建多组学cc RCC患者风险预后模型,并绘制临床可量化使用的列线图,从而为cc RCC的实验室基础研究、临床治疗和服务提供指导。研究方法以“Clear Cell Renal Cell Carcinoma”为关键词,在癌症基因图谱(The cancer genome atlas,TCGA)中检索相关数据。在整合患者全转录组数据的基础上,通过差异表达分析获取差异表达的mi RNA、lnc RNA和m RNA。随后基于mi Rcode、mi RDB、mi RTar Base与Target Scan等数据库构建mi RNA、lnc RNA和m RNA的关系文件,并采用Cytoscape构建ce RNA网络。采用Cox回归分析、最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,Lasso)回归分析筛选与患者生存相关的nc RNA并构建预后相关nc RNA风险预后模型。随后在整合患者DNA甲基化水平与全转录组数据的基础上,通过Methyl Mix筛选差异甲基化驱动基因,采用基因本体(Gene ontology,GO)富集分析查看其基因本体功能,采用Cox回归分析、Lasso回归分析筛选与患者生存相关的甲基化驱动基因并构建预后相关甲基化驱动基因风险预后模型。接着整合N~6-甲基腺嘌呤(N~6-methyladenosine,m6A)甲基化调控因子表达谱,在差异表达分析后,采用肿瘤分子分型分析验证m6A甲基化调控因子在转录组水平上能否反应患者生存情况,采用Cox回归分析、Lasso回归分析筛选与患者生存相关的m6A甲基化调控因子并构建预后相关m6A甲基化调控因子风险预后模型。最后整合以上所有数据,在去除多重共线特征基因后,构建多组学联合风险预后模型并绘制列线图。以上所有风险预后模型统一使用Cox风险回归分析、Kaplan-Meier生存曲线、Log-rank检验以及接受者操作特征曲线(Receiver operating characteristic,ROC)分析等方法,评价各个模型风险评分的预测准确性以及与患者其他临床特征相比能否作为患者预后风险独立预测因子。研究结果cc RCC患者全转录组差异分析共获取2322个差异m RNA,1483个差异lnc RNA与173个差异mi RNA。ce RNA网络中共得到198个节点与618条边,Cox与Lasso回归分析显示与患者生存显著相关的nc RNA共16个。联合DNA甲基化数据差异分析共筛选获取31个cc RCC甲基化驱动基因,GO富集分析显示,甲基化驱动基因主要参与免疫细胞分化增殖的调节、干扰素的产生、白介素-1正向调节等生物学过程。Cox与Lasso回归分析显示与患者生存显著相关的甲基化驱动基因共8个。整理m6A甲基化调控因子表达谱差异分析显示18种m6A甲基化调控因子在cc RCC中差异表达,肿瘤分子分型显示cc RCC患者被分为3个类群,且各个类群患者的生存情况具有显著差异(P<0.05),Cox与Lasso回归分析显示与患者生存显著相关的m6A甲基化调控因子共5个。在归一化的基础上整合以上数据,构建多组学联合风险预后模型,特征基因共19个,分别为LINC00887、PPP1R18、HHLA2、MAL、MYH14、TMEM173、HIST3H2A、PPP1R36、hsa-mir-21、hsa-mir-223、LINC00460、ARHGAP26-AS1、LINC00443、HOTTIP、PSORS1C3、HNRNPA2B1、IGF2BP2、IGF2BP3、EIF3A。多因素Cox风险回归分析、Kaplan-Meier生存曲线和Log-rank检验显示,以上四个风险预后模型均能区分高低风险cc RCC患者,且与其他临床特征相比,各个模型的风险评分均能作为患者预后风险独立预测因子。ROC分析显示,多组学联合预后模型AUC值最高(AUC=0.85),nc RNA风险预后模型次之(AUC=0.788),甲基化驱动基因风险预后模型AUC值紧随其后(AUC=0.743),m6A甲基化调控因子风险预后模型AUC值最低(AUC=0.703)。研究结论19个多组学联合风险预后模型特征基因与cc RCC患者生存预后密切相关,可作为cc RCC发生、发展、转移、耐药和预后相关多组学生物标志物。构建的多组学联合风险预后模型准确度明显高于其余单个组学维度的预后模型,绘制的列线图可用于预测cc RCC患者近5年的生存情况,在帮助临床医生做出更有效的治疗决策的同时,还有助于更好地了解cc RCC的发生发展机制,为进一步的实验室研究提供指导性意见。