论文部分内容阅读
研究背景:HBV在乙肝患者体内以准种的形式存在,早已经被学者证实。HBV病毒变异的多样性,既与病毒自身复制时多聚酶缺乏校正功能,容易产生随机突变有关,还与宿主免疫状态、抗病毒治疗的干预有关。不同的人群、不同的疾病阶段都会有不同的HBV准种变异特点。HBV准种变异与乙肝的诊断、治疗、疾病转归息息相关。目前研究较多的变异是HBV BCP区、preC/C区、preS/S区、RT区,例如BCP区的A1762T/G1764A双突变、preC区G1896A突变都会导致C基因转录的异常,会造成HBeAg合成障碍,且都与肝硬化、肝癌的发生有关。西藏地区地处高原地带,地理上、人文上都与外界相对隔离,在西藏藏族人群中,乙肝感染率高达12%以上,远高于国内平均感染率(6.1%)。目前对于藏族人乙肝病毒的研究发现,藏族人HBV流行株以C/D重组型为主,而汉族人以B、C型为主,目前对藏族C/D型HBV准种的研究较少,尚不清楚其是否具有独特的准种特点。HBV在人体内会受到宿主免疫压力的选择,病毒抗原经HLAⅠ类和Ⅱ类分子呈递表位肽,刺激CD8和CD4+T细胞应答,表位肽的变异会造成T细胞不能识别而出现免疫逃逸。因此不同HLA分子能驱动不同的HBV变异,对HBV变异存在限制性。目前研究较多的是HLAⅠ类分子限制的表位肽,例如HBV核心蛋白HBcAg 17-28aa是HLA-A2限制的抗原肽;对于藏族HBV感染者的HLA限制性目前则尚无相关研究。研究目的:本研究以西藏藏族乙肝感染者为研究对象,试图探讨藏族人HBV病毒准种特点,以及藏汉不同民族HLA遗传背景下对HBV的限制性,旨在加深HBV病毒准种变异及其HLA分子限制性的认识。方法:以1例C基因型HBV样本(pAAV-HBV质粒)为参考序列进行三代测序用于HBV全长准种分析的方法学探索,先对pAAV-HBV质粒进行HBV全长PCR扩增,在三个独立的测序单元(cell)中加入相同量的质粒扩增产物,通过BioEdit7.0、MEGA 7.0等生物信息工具对测序序列的分析,得出三代测序的错误率,以及用于准种分析的遗传距离、突变率的合理阈值。以2016-2017年在西藏藏南地区进行流行病学调查时采集到24例HBsAg阳性患者为研究对象,同时于2017年在西南医院感染科门诊匹配收集24例汉族乙肝感染者血液样本作为对照组。从100ul血清中提取HBV DNA,通过PCR扩增HBV全基因组,进而利用第三代DNA测序平台PacBio RS II对HBV进行全长测序;同时从血细胞样本中提取人gDNA,利用SBT(Sequence-Based Typing)分型方法对HLA-A、B、C、DRB1、DPA1、DPB1、DQA1、DQB1八个位点进行四位数字的高分辨率分型。利用PacBio SMRT Tools进行测序数据的拆分及CCS(Circular consensus sequences)序列的生成;序列编辑用BioEdit7.0完成;序列比对用Clustal W 2.1、Muscle 3.8、T-Coffee11.0来完成。核酸替换模型的测试用Modeltest3.7完成。系统进化分析采用MEGA 7.0进行,进化树的构建采用邻接法(Neighbor-Joining),进化树可靠性分析采用自助抽样法(Bootstrip Method),Bootstrip重复次数选择500次以上。进化树的分析处理采用FigTree v1.4.3完成。重组分析采用Stuart C.Ray开发的SimPlot 3.5进行。病毒准种特点用两种方法描述:香农熵(Shannon entropy,Sn)和平均遗传距离(mean genetic distance,d),前者计算公式为:Sn=-Σi(piInpi)/InN,pi为第i个种群序列出现的频率,N为总的种群数量。遗传距离用MEGA 7.0计算,核酸替换模型选择TN+G(Tamura-Nei model+Gamma distribution),同时用校正的Nei-Gojobori method(Jukes-Cantor)+G模型计算同义突变率(Synonymous mutation,dS)及非同义突变率(Nonsynonymous mutation,dN)。借助人工神经网络在线工具NetMHC 4.0 Server和NetMHCⅡ2.3 Server分别预测HLAⅠ、Ⅱ类分子与HBV肽段的亲合力(网址:https://www.cbs.dtu.dk/services/)。结果:1.第三代测序平台PacBio RS II用于HBV全长测序方法具有可行性,平均读长可达到3.4kb,其测序总错误率为2.13%,插入错误为主,其次为缺失和错配,分别为1.45%、0.62%、0.06%。测序读长越长,测序错误率就越低。运用生物信息学方法删除插入错误后总错误率降低到0.69%下。HBV准种分析中将遗传距离阈值设定为0.01,突变筛查阈值设定为3.5%。2.藏族人HBV以C/D重组型为主,且有两种重组类型:C2/D4型与C2/D3型,前者是D4型的1-750nt片段与C2型重组,后者是D3型的1-1500nt片段与C2型发生重组。C2/D4为主要的优势毒株(77.8%)。3.C/D重组型HBV比对照组在preC/C区有更高的复杂度(P=0.006)和非同义突变率(P=0.006)。C/D型HBV准种变异主要集中在EnhⅡ区(1636-1744nt)、BCP区(1742-1849nt)和preS区(2848-152nt),包括C1653T突变(44.4%)、T1753V/A1762T/G1764A三联突变(44.4%)、preS的缺失突变(33.3%)等。汉族对照样本变异集中在preC、S基因、X基因,包括G1896A变异(35.0%)、sS143T变异(70.0%),及xV5L变异(75.0%)等。4.藏族人HLAⅡ类分子基因型HLA-DRB1*12:01:01G(55.6%vs 5.6%,P=0.008)、DQA1*05-DQB1*03:01(77.8%vs 16.7%,P=0.004)要多于汉族人,而HLAⅠ类分子中HLA-B*40:01比汉族对照少(0%vs 50.0%,P=0.012)。提示藏族人HLA的遗传背景不同与汉族人。5.HBV X基因36aa(1479nt)位点变异在HLA-DRB1*12:01:01G样本中更多见(66.7%vs 14.3%,P=0.024),P基因268aa(3108nt)位点变异在HLA-DQA1*05-DQB1*0301样本中更多见(50.0%vs 5.9%,P=0.015),前者可能位于DRB1*12:01:01G限制的表位区,后者可能位于DQA1*0501-DQB1*0301限制的表位区。提示在藏族人与汉族人在自身不同的HLA遗传背景下,会驱动不同的HBV准种变异。总结:我们探索了第三代测序技术用于HBV全长准种分析的具体方法,确立了HBV准种遗传距离及突变的阈值。发现了C2/D4重组型HBV是藏族人中的优势毒株,同时在HBV全基因组水平探讨了藏族、汉族不同的乙肝病毒准种变异特点。结合HLAⅠ类、Ⅱ类分子的高分辨率分型,初步认识了藏族、汉族人HLA分子的差异,及其对HBV准种变异的限制性。