论文部分内容阅读
目的:采用候选基因研究方法,运用基因组学技术,通过多位点遗传关联分析,探索NAFLD发病的易感基因位点及其基础核心证候-脾阳虚证的基因组生物标志物,并结合基因多态性和代谢危险因素,建立并评价NAFLD的风险预测模型。方法:基于自主建立的上海浦东张江地区NAFLD“病-证”研究队列及“病-证”生物样本库,从2017年4月至2018年7月在张江地区采集汉族人群,采用以社区自然人群为基础的病例-对照研究设计,纳入NAFLD病例组341例(包括脾阳虚证组163例和非脾阳虚证组178例)、健康对照组341例和验证集332例进行资料收集与标本采集。选取源于GWAS或候选基因研究报道的来自11个基因的22个SNP多态性位点,采用Sequenom平台的Mass ARRAY技术进行基因分型。统计分析方法包括遗传关联分析、连锁分析、Logistic回归模型、ROC分析及趋势检验等,分析过程采用SPSS 21.0、SHEsis、Haploview 4.2、Med Calc 17.1.0等软件并参考相关的生物信息学数据库。结果:剔除实验设计失败位点,本研究的所有SNP等位基因频率分布与1000Genomes Project数据库东亚人群中的分布大致相近,各基因型在对照组人群中的分布均符合HWE定律,研究对象具备群体代表性。1.NAFLD的多位点遗传关联研究结果显示:(1)GCKR的rs1260326、rs780094、rs780093和MBOAT7的rs626283、rs641738的等位基因频率分布具有差异(P<0.05);PNPLA3的rs2294918和GCKR的rs1260326、rs780094、rs780093的基因型频率分布具有差异(P<0.05);(2)进一步的5种遗传模型的基因型关联分析结果显示GCKR的rs1260326、rs780094、rs780093和MBOAT7的rs641738与NAFLD发生风险均呈正相关,且风险等位基因均为T,经校正性别、年龄、BMI、吸烟混杂因素后,rs1260326、rs780094及rs780093均在共显性、显性、隐性、加性模型下增加了NAFLD的风险(P<0.05);rs641738在加性模型下增加了NAFLD的风险(P<0.05);(3)连锁分析显示GCKR的rs1260326-rs780094-rs780093处于一段强连锁不平衡区块中;单倍型分析显示当这3个SNP的单倍型为C C C时,降低了NAFLD的风险(P<0.05);而单倍型为T T T时,增加了NAFLD的风险(P<0.05)。2.基于基因多态性和代谢危险因素的NAFLD的风险预测模型研究结果显示:(1)GCKR的rs780094和MBOAT7的rs641738携带的风险等位基因数目的相加效应显示随着风险等位基因数目的升高,NAFLD的发生率呈线性升高趋势(趋势P<0.05);经校正混杂因素,随着风险等位基因数目的升高,NAFLD的发生风险也随之升高,且OR值的差异呈线性升高趋势(趋势P<0.001);(2)基于单因素和多因素逐步回归分析,筛选出4个与代谢相关的NAFLD危险因素,包括BMI、WC、FPG、TG,采用Logistic回归模型,计算出一种与代谢危险因素相关的NCI模型参数用于预测NAFLD的发生风险;(3)ROC分析显示结合基因多态性相加效应和NCI的NCI+SNP,在训练集和验证集中对于预测NAFLD的发生风险的AUC值均为最高,在验证集中AUC达到0.757,统计学差异显示均高于NCI以及HSI、Ty G、LAP(P<0.05)。3.NAFLD脾阳虚证的基因组标志物研究结果显示:(1)在NAFLD脾阳虚证组和对照组的比较中:GCKR的rs1260326、rs780094、rs780093的等位基因和基因型频率分布均有差异(P<0.05);5种遗传模型的基因型关联分析结果显示这3个SNP均与脾阳虚证出现呈正相关,且风险等位基因均为T,经校正混杂因素,这3个SNP均在共显性、显性、隐性、加性模型下增加了脾阳虚证的风险(P<0.05);(2)在NAFLD非脾阳虚证组和对照组的比较中:这3个SNP的等位基因和基因型频率分布均无差异,经校正混杂因素,在不同遗传模型下均无关联(P>0.05);在NAFLD脾阳虚证组和非脾阳虚证组的比较中:这3个SNP的等位基因和基因型频率分布均有差异,经校正混杂因素,在相关遗传模型下出现关联(P<0.05);(3)连锁分析显示这3个SNP处于一段强连锁不平衡区块中;单倍型分析显示当单倍型为C C C时,降低了脾阳虚证的风险(P<0.001);而单倍型为T T T时,增加了脾阳虚证的风险(P<0.001);(4)进一步探讨这3个SNP与脾阳虚证程度变化的关系显示随着脾阳虚证程度的加重,等位基因C频率占比下降(趋势P<0.05),T频率占比未见差异(趋势P>0.05);而携带rs1260326和rs780094的突变型CT-TT的个体较野生型CC的脾阳虚证评分均更高(P<0.05),但在rs780093中未见差异(P>0.05)。结论:1.GCKR的rs1260326、rs780094、rs780093及MBOAT7的rs641738与汉族人群NAFLD发生相关联。2.基于GCKR的rs780094、MBOAT7的rs641738的相加效应和代谢危险因素结合的风险预测模型,对于NAFLD发生风险的预测能力较高。3.GCKR的rs1260326、rs780094、rs780093是NAFLD脾阳虚证的基因组生物标志物,与脾阳虚证的程度变化相关。