论文部分内容阅读
[背景]长链非编码 RNA(long noncoding RNA,lncRNA)可作为微小 RNA(microRNA,miRNA)的海绵调节蛋白质编码基因的表达;因此,lncRNA被认为是竞争性内源RNA(competitive endogenous RNA,ceRNA)网络的主要部分,并且已引起越来越多的关注。本研究探讨了 lncRNAs作为ceRNA在肝细胞肝癌(hepatocellular carcinoma,HCC)中的调控机制和功能作用及其对HCC患者预后的潜在影响。[方法]在本研究中,我们系统地研究了来自5个HCC队列(TCGA,GSE54236,GSE76427,GSE64041和GSE14520)的总共838名HCC患者的lncRNA,miRNA和mRNA的表达谱和预后数据。其中,我们使用TCGA,GSE54236和GSE76427 HCC队列的数据通过生物信息学方法构建与预后相关的失调的ceRNA网络,并且使用GSE64041和GSE14520 HCC队列的数据来验证候选基因的表达模式。[结果]721个lncRNA,73个miRNA和1,563个mRNA在HCC样品和配对癌旁肝组织样本中差异表达。我们构建了由26个lncRNA,4个miRNA和6个mRNA组成的ceRNA网络。生存分析显示 4 个 lncRNA(MYCNOS,DLX6-AS1,LINC00221 和 CRNDE)和 2个mRNA(CCNB1和SHCBP1)是HCC患者潜在的预后生物标志物。[结论]我们提出的ceRNA网络可能有助于阐明lncRNA作为ceRNA在HCC中发挥作用的调节机制,并有助于HCC的发病机制。重要的是,参与ceRNA网络的候选lncRNA,miRNA和mRNA可作为HCC的潜在治疗靶标和预后生物标志物。[背景]肝细胞肝癌(hepatocellular carcinoma,HCC)是世界上最致命的恶性肿瘤之一,并且其发病率每年都在增加。随着HCC管理和影像学技术的发展,高风险人群(如患有肝炎病毒的人群)得到密切监测,部分HCC能被早期诊断。尽管如此,仍有大多数肝癌切除患者复发率高,而且预后仍不尽人意。肝癌的精准预后预测,有助于早发现预后差的患者并予以积极有效的治疗,同时避免对预后好的患者进行过度治疗,达到优化利用宝贵的医疗资源的目的,这具有重要的科学及社会意义。目前,以单一的生物标志物或者临床数据去预测预后的传统方法缺乏系统性评估,从而缺乏高的敏感性和特异性。由于肝癌涉及复杂的分子调控机制,目前临床上传统的病理分期不能完全反映肿瘤异质性,预测预后能力欠佳。因此基于大数据构建基因测序数据与临床数据相结合的预测模型成为了提高临床疗效的迫切需要,这具有临床转化的重大潜力。本研究是目前首个结合肝癌大样本的基因测序数据及随访良好的临床资料,利用人工智能模拟的机器学习方法构建稳定高效、重复性高、经济、适合我国国情的肝癌个体化预后模型的研究,以实现对肝癌患者预后的预测和精准治疗。[方法]本研究从癌症基因组图谱(The Cancer Genome Atlas,TCGA)公共数据库中下载371例HCC患者组织样本的mRNA-seq数据(level 3)和相应的临床信息,并以此作为训练集,并且在基因表达综合库(Gene Expression Omnibus,GEO)中下载78例HCC患者的芯片数据和相应的临床信息作为验证集。将在癌组织与癌旁组织之间差异表达16倍以上,且校正后的P<0.001的基因认为是具有差异表达的基因。在训练集中,我们首先采用单因素Cox回归分析选出与预后相关的基因。接着我们采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,Lasso)-Cox惩罚回归模型筛选与预后相关的基因(在进行1000次10折交叉验证后选重复出现次数超过900次的基因)。最后把这些基因进行逐步多因素Cox回归建模,筛选出一个最佳的与生存相关的线性风险评估模型模型,并根据这个模型给每一个患者进行风险评分。我们采用单因素及多因素Cox回归的方法评估临床各变量及预后模型与患者预后的相关性,并判断风险模型是否能够作为一个独立的预后指标。随后把从TCGA数据库训练集得到的预后模型在GEO数据库验证集中进行验证。接着我们采用联合风险模型与临床病理高危因素构建联合模型(以列线图的形式展示)看能否提高预后预测价值。[结果]在肝细胞肝癌和癌旁对照组织之间筛选出总共339个差异表达基因。通过单因素,Lasso和多因素Cox回归分析构建了由四个基因组成的预后模型,这四个基因分别是 centromere protein A(CENPA),secreted phosphoprotein 1(SPP1),MAGE family member B6(MAGEB6)和 homeobox D9(HOXD9)。基于这个预后模型进行分组,高风险患者的生存期显著低于低风险患者的生存期(中位生存期:3.42年比6.15年,P<0.0001)。然后,使用GEO外部验证集验证了该预后模型,得到的结论和训练集的结果一致,用此模型来分组,高风险患者的生存期显著低于低风险患者的生存期(中位生存期:0.99年比2.26年;P<0.0001)。单因素和多因素Cox回归分析也显示了预后模型是独立的预测因素(P<0.05)。最后构建由预后模型和临床特征组成的联合模型列线图,并进行训练集的内部验证。受试者工作特征(receiver operating characteristic,ROC)曲线和决策曲线分析(decision curve analysis,DCA)显示列线图是最优模型。与传统的病理分期系统相比,列线图的预测能力提高了12%(一致性指数(Concordance index,C-index)为 0.57 比 0.69,P<0.01)。[结论]基于机器学习的方法构建的肝细胞肝癌患者预后模型和列线图可以准确预测肝细胞肝癌患者1年,3年和5年的生存率,可以作为肝细胞肝癌患者治疗和随诊依据。[背景]TP53突变是肝细胞肝癌(hepatocellular carcinoma,HCC)中最常见的突变,它影响HCC的进展和预后。我们研究了 TP53突变如何调节HCC免疫表型,从而影响HCC患者的预后。[方法]我们在不同人群和平台中研究了 TP53突变状态和RNA表达,并构建了基于TP53野生型和TP53突变型HCC样本之间差异表达免疫基因的免疫预后模型,然后综合分析了免疫预后模型对HCC免疫微环境的影响。[结果]TP53突变导致HCC中免疫应答的下调。312个免疫相关基因中的37个在不同的TP53突变状态中差异表达。我们基于865名HCC患者构建并验证了免疫预后模型,以区分生存率高或低的患者。我们还构建了用于临床应用的列线图。功能富集分析表明 humoral immune response 功能和 immune system diseases 通路分别代表了与免疫预后模型基因相关的主要功能和通路。此外,我们发现于低风险组相比,高风险组患者的滤泡辅助性T细胞,调节性T细胞和巨噬细胞MO的比例较高,并呈现较低的细胞毒性T淋巴细胞抗原-4(cytotoxic T-lymphocyte antigen-4,CTLA-4),程序性细胞死亡蛋白-1(programmed death-1,PD-1)和T细胞免疫球蛋白及黏蛋白分子-3(T cell immunoglobulin and mucin-domain containing-3,TIM-3)的表达。[结论]TP53突变与HCC中的免疫微环境密切相关。我们的对TP53突变状态敏感的免疫预后模型,对鉴定高风险组和低风险组HCC患者亚组具有重要意义。