论文部分内容阅读
高海拔极端环境对人类的选择压力包括寒冷、强紫外照射以及低氧,其中低氧是唯一人类无法借助传统工具或技术完全克服的环境压力。虽然最初对高海拔地区人群的研究主要集中在安第斯山脉的高原人群,但近年来研究者开始关注藏族人群对高原低氧环境的适应。 近年对藏族人群全基因组的研究试图找出基因组中的关键基因,以解释藏族人群适应高原低氧环境的表型性状与其遗传之间的关系。研究者用不同的方法对比藏族人群与平原人群(例如汉族)的基因组,发现EPAS1与EGLN1这两个位于低氧代谢通路上的关键基因在藏族人群中存在群体特异的序列变异和显著的正选择信号,提示它们对藏族的高原低氧适应可能有重要的贡献。 我们对46个藏族个体的EGLN1基因区域进行重测序,发现该基因区域有在藏族人群中有两个改变氨基酸的单核苷酸多态性位点,其中一个改变第4个氨基酸,另一个改变第127个氨基酸。改变第4个氨基酸的位点rs186996510(D4E)的衍生型在藏族人群中频率较高(约为63.27%),而在其他世界代表人群中的频率均不足2.5%。改变第127个氨基酸的位点rs12097901(S127C)的衍生型在藏族人群中频率较低(约为20.65%),而在其他世界代表人群中的频率介于52.06%至92.35%之间。同时,基于频率的遗传差异度FST的计算结果表明汉藏之间在位点rs186996510的差异度约为0.709,是EGLN1基因所处的1号染色体汉藏之间平均差异(0.0102)的近70倍,而在位点rs12097901的差异度约为0.189。基于EGLN1单倍型的网络结构图分析结果与用Fay and Wu的中性检验方法分析得到的结果相一致,它们都表明藏族人群中存在群体特异的单倍型,这提示我们该区域具有达尔文正选择的信号。 我们对大样本量靶位点基因分型的结果显示,rs1g6996510(D4E)的衍生型频率与海拔具有一定的正相关,这进一步说明该位点对藏族人群的高原低氧环境适应性可能具有贡献。基因型-表型相关性分析的结果表明,藏族男性个体中两个改变氨基酸的位点与血红蛋白浓度具有显著的相关性。这一结果提示我们,该位点可能对藏族适应高原低氧环境具有潜在的功能效应。多态位点rs186996510(D4E)所处EGLN1的位置编码第4个氨基酸,靠近基因编码蛋白PHD2的N端,但并不在目前已知的3个功能域的范围内。我们通过比对多个物种的该蛋白氨基酸序列发现,祖先型对应的天冬氨酸在不同物种之间都非常保守,这提示我们天冬氨酸在功能上对EGLN1所编码的蛋白PHD2非常重要,而由天冬氨酸突变为谷氨酸有可能使蛋白PHD2在功能上发生改变。 我们进一步对受选择的等位基因的起源时间及其选择强度进行计算的结果表明,其起源于距今大约8400年前。该起源时间的估算结果比此前估算EPAS1受到选择的时间(距今大约18000年)晚了近1万年。有两种可能形成这样的差异:一种可能是这两个基因的突变型是随着人群迁徙分两次进入现今的藏族人群;还有一种可能,两个基因的适应型突变最初都被带入青藏高原,只是自然选择发生在不同的时期。