论文部分内容阅读
人类主要组织相容性抗原系统(MHC)即白细胞抗原系统(HLA)是人类基因组中多态性最高的区域,其编码的糖蛋白分子在人类免疫反应中起着至关重要的作用。对HLA与疾病的相关性研究,早期主要集中于经典座位等位基因外显子的分型,但是其中大多数疾病的遗传因素仍没有得以完全阐明,这主要是由于MHC区域高度的连锁不平衡和异常复杂的进化模式。近年来,人们对非编码序列的重要性重新认识,对HLA多态性的研究已经扩展到HLA Ⅰ、Ⅱ类基因外显子以外的区域。对HLA全基因区域进行多态性的详尽的分析,对基础和临床研究具有重要意义。本文围绕HLA-DP区域的多态性和分子进化机制展开研究。
首先,本文采用“长片段PCR扩增、克隆、测序后拼接”的策略,获得了26条中国汉族个体HLA-DPA1-DPB1全长24kb的单倍型序列,建立了全基因的高密度遗传多态性图谱。这也是首次在该区域得到的全长范围内的群体数据。对该区域进行群体遗传学分析,发现整个基因区域的高多态性具有跨物种分布的特点,表明受到了平衡选择作用。对整个区域的连锁不平衡分析表明,DPB1的第一外显子到第二内含子的重组热点,使DPA1和DPB1分成了两个大的单倍域,相互之间连锁程度不高,而各单倍域内则高度连锁。两个基因的3’区域都呈现出高度的多态性,并且与附近较长片段序列高度的连锁不平衡。
本文进一步对DPA1和DPB1的3’非翻译区的进化机制进行了详细研究。首次发现HLA-Ⅱ类基因的3’非翻译区存在着跨物种多态性,异常高的种内差异和种间差异比值,并且一系列的中性检验均显示其受到了平衡选择作用。通过与HLA-Ⅰ类基因3’非翻译区比较我们发现,HLA-Ⅰ类基因的3’端显示出一定的保守性,表明受到了负选择作用。推测HLA两类分子不同的表达方式和调控需要,使它们经历了不同的进化机制。Ⅰ类分子趋向于稳定性表达,因而受到负选择作用,Ⅱ类分子趋向于特异性调控,因而受到平衡选择作用。我们进一步用生物信息学的方法预测到DP-3’UTR上存在潜在的miRNA的目标靶位点。本文还调查了DPB1-3’UTR在世界其他人群中的频率分布,表明群体间两类单倍型的分布频率表现出显著性差异。
同时,为了调查HLA区域的多态性背景,本文对HLA-DPA2假基因,以及DPB2假基因3’端的一段基因间区域做了群体遗传学研究,以期为其他功能基因的研究提供参考的素材。对DPB2 3’区域4.5kb长的片段多态性进行分析表明,这一片段符合中性进化模式。而对DPA2全长4kb序列多态性数据分析以及与家猫,黑猩猩,恒河猴等动物的DPA2的序列比较发现,该基因的进化偏离中性模型,在长期的进化过程中受到了负选择压力而表现出保守性,而在较近期的进化过程中选择压力发生变化,突变速率加快。可见HLA区域的复杂的高变性的特点是在进化过程中受到了多方面的复杂的压力共同作用的结果。