论文部分内容阅读
蛋白质是生命活动的主要承担者,同时也是大部分药物的作用靶点,具有重要的研究意义。蛋白质组学(Proteomics)是以蛋白质为研究对象,主要采用质谱(Mass spectrometry,MS)技术研究细胞、组织或生物体内全部蛋白质组成及其变化规律的学科。现阶段,基于质谱的蛋白质组学可对生物样本中蛋白质进行深度的定性和定量分析,推动了生命科学和医学等相关研究的进展。原发性肝癌是我国发病率第四位、死亡率第二位的恶性肿瘤,主要分为肝细胞癌(Hepatocellular carcinoma,HCC)和肝内胆管细胞癌(Intrahepatic cholangiocarcinoma,i CCA)。原发性肝癌患者早期无明显临床症状,大多数患者通常在确诊时已是晚期,失去手术机会,预后差,复发率高,生存质量不容乐观。目前临床治疗原发性肝癌的手段有限,缺乏合适的早期诊断生物标志物和分子靶向药物。因此需要深入了解原发性肝癌内在的生物学联系和疾病分子特征,以寻找可用于临床诊断和治疗的生物标志物及潜在药物靶标。在此前已有的HCC蛋白基因组学研究的基础上,本文利用基于质谱的蛋白质组学技术,首先揭示了i CCA的全景式分子图谱,确定疾病分型并进行亚型特征分析,发现潜在的生物标志物和药物靶点,为肝癌的临床预后分析和靶向治疗提供新的可能性。其次,通过对HCC癌旁组织(Normal tissue adjacent to tumor,NAT)和正常肝脏组织进行蛋白质组学研究,揭示其异质性和分子特征,发现潜在生物标志物和疾病进展相关的蛋白质,从而为HCC临床早期诊断提供组学数据支持。第一部分工作我们采用基于质谱的蛋白质组学技术,获得了中国i CCA患者的大队列临床组织样本的蛋白质组学和磷酸化蛋白质组学数据,联合基因组学、转录组学和微生物组学数据,进行多组学联合分析。通过i CCA全景式分子图谱分析,发现i CCA样本中含有黄曲霉毒素诱导的基因突变“指纹”,且其与肿瘤的发生、增殖和免疫抑制有关。体细胞染色质拷贝数变异(Copy number alteration,CNA)的顺/反式效应影响m RNA、蛋白质和磷酸化蛋白质的表达丰度,通过通路富集分析发现CNA的顺/反式效应与一些蛋白质丰度的变化及部分信号通路的变化相关性较大。此外,遗传信息突变的相关信号谱显示,TP53、KRAS、BAP1和IDH1/2基因突变会改变下游相关蛋白质和磷酸化的丰度,从而影响到疾病的发生发展。TP53/KRAS双突变可能通过整合素-Fak/SRC途径促进了i CCA的转移,从而导致更差的预后表现。通过与药靶数据库进行联合分析,发现不同基因突变肿瘤中高表达的蛋白质可作为潜在的个性化药物治疗靶标,并对携带对应基因突变患者来源的原发癌细胞系(Patient-derived primary cancer cell lines,PDPCs)进行了验证。通过蛋白质组分析,i CCA患者被分成了4个亚型,组学数据整合分析揭示4型患者具有各自特异性的亚型特征。通过降维分析,找到了可特异性区分4个亚型的蛋白质生物标志物,并在不同i CCA大样本队列中通过组织芯片进行了多色荧光染色验证。采用临床风险模型对蛋白质组学数据进行分析,发现了两种i CCA潜在的预后蛋白质生物标志物HKDC1和SLC16A3蛋白,其预后指示价值均通过免疫组化实验在独立队列肝癌临床样本中得以验证。发现FGFR2基因的融合突变可导致Rho GTPase通路的激活,从而导致i CCA的发生发展。此外,通过免疫多肽组学实验,我们成功在过表达了FGFR2-BICC1融合蛋白的i CCA细胞中鉴定到包含融合区段的新生抗原小肽,提示了个性化免疫治疗的可能性。第二部分工作我们采用基于数据非依赖采集模式(Data independent acquisition,DIA)的定量蛋白质组学技术,获得了106例包含了正常肝脏组织、HCC NAT和HCC肿瘤组织的深度蛋白质组学数据,通过多层次整合分析,揭示HCC NAT的分子特征和异质性。结合前期研究中的基于TMT标记的159例HCC NAT样本的定量蛋白质组学数据进行分析,发现基于肿瘤组织蛋白质组的3个亚型中NAT的蛋白质呈现差异表达,且发现NAT可一定程度上反映肿瘤组织的分子特征。通过对表达变化最大的759种蛋白进行聚类分析,将159例NAT分成2个亚型,且患者的预后和复发有着显著差异,2个亚型也具有不同的亚型特征。采用DIA定量蛋白质组学方法对正常肝脏组织、两个亚型的NAT及其配对的肿瘤组织进行分析,结果表明亚型1 NAT的蛋白表达和通路富集情况与正常肝脏组织相似,通过对差异表达的蛋白质进行分析,发现一些蛋白质可能参与HCC早期事件,其中包括13种在NAT中上调的分泌蛋白。而通过对比亚型2中的NAT和正常肝脏组织的蛋白表达情况,发现二者有着更为显著的差异,下调的蛋白主要富集在代谢性相关通路中。此外,我们按照正常肝脏组织、NAT和肿瘤组织的顺序对鉴定到的蛋白进行mfuzz聚类分析,发现了762种表达递减的蛋白,且主要富集在脂肪酸代谢、细胞氨基酸代谢、脂质分解代谢、有机阴离子转运和核苷二磷酸代谢等代谢性生物过程中。此外还发现了365种表达递增的蛋白,可能参与HCC肿瘤的发生发展,尤其是代谢性蛋白。通过多个数据库比对,筛选出9种与预后不良相关的代谢性蛋白,其中有7种已被报道与HCC的发生发展有关,通过对另外2种蛋白质(GPD1L和SRM)进行细胞功能实验,结果表明这2种蛋白质可能会促进HCC的发生发展。综上所述,我们通过基于质谱的蛋白质组学技术,分别对i CCA和HCC NAT进行了系统性的研究,揭示原发性肝癌内在的生物学机制,为其临床上的诊断和治疗提供了更多的组学数据依据。