论文部分内容阅读
背景:EB病毒(Epstein-Barrvirus,EBV)广泛感染人类,引发多种疾病包括恶性肿瘤,其中与鼻咽癌发病密切相关——在约98%的鼻咽癌患者的肿瘤组织中,可以检测到EBV的核酸。目前,已有多种EBV毒株的基因序列发表,不同肿瘤来源的EBV毒株携带不同的基因变异。EBV的变异可能在其致瘤过程中发挥作用,从而影响特定类型肿瘤的生物学行为。然而,对与鼻咽癌相关的EBV基因变异尚缺乏系统性研究。鼻咽癌是一种具有高度侵袭性和转移性的恶性肿瘤,目前,TNM分期系统是鼻咽癌治疗决策和预后评估的主要依据。然而,该系统对于评估鼻咽癌预后的价值有限,已经不能完全满足临床需求。目的:这一博士学位课题的研究工作基于转录组测序数据分析,目的有二,①发现、鉴定与鼻咽癌相关的EBV基因变异,解析不同EBV亚型与鼻咽癌临床特征的关系,初步揭示鼻咽癌相关EBV基因变异的生物学功能。②筛选、构建鼻咽癌预后分子模型。方法:本项研究共纳入两组鼻咽癌患者;第一组67个病例,主要参加转录组测序及相关分析;第二组32个病例,主要参加EBV基因变异的验证分析。此两组鼻咽癌病例互为独立样本。针对第一组67例鼻咽癌患者的肿瘤和癌旁组织进行转录组测序。对测序数据进行生物信息学分析,从中发现鼻咽癌相关EBV的基因变异。采用RNA原位杂交技术BaseScope联合免疫组化共染色的方法,在第二组32例鼻咽癌组织样本中对测序发现的EBV基因变异进行验证。将上述在鼻咽癌中发现、鉴定的EBV变异位点,与公共数据中非鼻咽癌来源的EBV序列进行聚类分析;从中找出鼻咽癌相关的EBV亚型,并分析不同病毒亚型与鼻咽癌患者临床特征及预后的关系。另外,采用常规细胞分子生物学方法,建立稳定表达上述EBV变异基因的鼻咽癌细胞株,通过体外实验探索鼻咽癌相关EBV变异基因的基本生物学功能。构建鼻咽癌预后分子模型的工作,从第一组参加转录组测序的67例鼻咽癌患者之中选择随访信息完善的60例入组,分为“复发转移组”和“非复发转移组”两组。通过对测序数据的分析,采用随机森林和极限梯度提升的机器学习方法,筛选出宿主的与鼻咽癌预后相关的特征基因。基于这一组特征基因,进一步采用Cox 比例风险回归模型构建鼻咽癌预后模型。继而采用GSEA和相关性分析,评价该模型的医学生物学功能。结果:①转录组测序结果显示,入组的鼻咽癌组织中存在EBV基因变异。其中,EBER2和LMP2基因具有最高的变异频率,分别在65/66和64/66例鼻咽癌组织中被检测到。②采用BaseScope和免疫组化共染技术,在独立样本32个鼻咽癌病例中以单细胞原位的方式验证了测序检出的EBER2的变异;并且证明携带病毒变异的细胞为肿瘤(上皮)细胞,而不是肿瘤组织中的浸润免疫细胞,由此明确了 EBV变异活跃转录的组织细胞来源。③根据EBER2的变异位点,将测序获得的EBV序列与已发表的EBV序列进行聚类分析,可将EBV分为两种亚型:EB-1和EB-2。其中,根据EBER2 7123位点,可进一步将EB-2细分为A>T和A>G两种亚型。EB-1基因型EBV显著富集于鼻咽癌(卡方检验,p<0.0001);而EB-2亚型富集于中国北方鼻咽癌患者,且与肿瘤T分期相关(卡方检验,p<0.05)。生存分析显示,相较于EB-1亚型和EB-2-A>G,感染EB-2-A>T亚型EBV的患者预后最差(Log-rank,p=0.026)。④结合宿主mRNA表达谱数据进行差异表达基因分析和富集分析发现,EB-1和EB-2亚型参与影响宿主细胞不同的生物学过程。其中,EB-1亚型主要激活“Epithelial mesenchymal transition”,而 EB-2 亚型则主要激活“MYC targets v1”等。⑤针对另一个发生高频率变异的病毒基因LMP2变异的体外实验分析发现,相较于对照组,变异的LMP2B有显著促进鼻咽癌细胞增殖、迁移,抑制凋亡的作用。构建鼻咽癌预后分子模型的工作,对于转录组测序数据重点关注宿主的基因表达。⑥采用机器学习方法筛选出“复发转移组”和“非复发转移组”之间的特征基因,共 13 个:CES4A、GIMAP1.GIMAP5、GLB1L、LGR5、LOC730098、MLF1、MTHFD1L、MYLPF、NUP160、SIRPB1、TCN2、TMEM265、U2AF1L5。⑦基于这些特征基因构建Cox风险比例模型,得到一个4-mRNA signature,包括U2AF1L5、TMEM265、GLB1L和MLF1基因。根据这一模型计算每个患者的风险评分,并将患者分为高风险组和低风险组。⑧Kapan-Meier生存曲线和ROC曲线分析显示,这一预后模型能较好地评估鼻咽癌患者的预后,高风险组患者预后显著差于低风险组(Log-Rank,总生存:p=0.00126,无病生存:p=0.000059)。这一 4-mRNA signature在评估患者总生存以及无病生存的效果(AUC分别为0.893和0.86,)优于T分期(AUC为0.619和0.538)及N分期(AUC:0.582和0.622)。⑨多因素Cox分析结果显示,风险评分是鼻咽癌的独立预后因素(总生存,HR=14.501,p=0.012,无病生存:HR=13.752,p<0.001)。⑩GSEA 富集分析发现 4-mRNA signature 与细胞增殖和宿主免疫应答密切相关。结论:鼻咽癌组织中存在EBV基因变异。其中EBER2和LMP2基因具有最高的变异频率。鼻咽癌组织内发生基因变异的EBV存在于肿瘤细胞而非浸润免疫细胞中。根据EBER2的变异模式,可将EBV分为两种亚型:EB-1和EB-2;它们与鼻咽癌患者的临床特征、预后相关,并可能与宿主发生不同的相互作用。通过对转录组数据的分析挖掘,构建了包含4个基因的4-mRNA signature模型,可用于鼻咽癌预后评估。