论文部分内容阅读
目的:心血管疾病(Cardiovascular disease,CVD)是目前中国和世界范围内疾病死亡的首位原因。我国40%死亡的原因归因于心血管疾病,心血管疾病负担十分沉重。高血压一直是公认的心血管事件的独立危险因素,而我国有超过50%的CVD发病与高血压相关。最新的全国数据显示,我国高血压人口已经超过3亿,而我国东北农村地区的高血压患病率高达50%。因此,针对中国农村高血压人群的心血管疾病的防控迫在眉睫,而心血管总体风险评估和危险分层是心血管疾病防治的重要策略。目前许多风险评估模型已被用于预测普通人群的心血管风险,但其在高血压人群中的适用性有待评估。而且风险预测模型存在缺点,因为大多数明显的心血管疾病发生在具有低到中等风险的非常大的人群中。近来有研究表明,在心血管病中等风险的个体中,代谢组特征增加了标准临床变量之外的增量的辨识能力,此外代谢组学风险谱的识别能改善心血管疾病的风险分层。因此,本研究以东北农村高血压人群的前瞻性队列研究为基础,旨在了解东北农村地区高血压人群心血管疾病的流行情况;基于LASSO-COX分析构建高血压人群的心血管疾病风险评估模型;应用非靶向代谢组学研究拟探索出高血压人群心血管疾病发病的新型危险因素,进一步完善我国高血压患者心血管疾病危险分层和防治策略。研究方法:1.利用2012年至2013年在中国东北农村地区进行的中国东北农村心脑血管健康研究(NCRCHS)建立的自然人群队列,根据2017年美国心脏病学会/美国心脏协会高血压指南的定义筛选出高血压人群,分析基线调查时心血管疾病的患病情况及应用Logistic回归分析心血管疾病患病风险情况。2.NCRCHS研究于2015年-2018年进行了随访,收集新发的心血管疾病事件。我们纳入基线无心血管疾病的高血压人群,按照2:1随机分为建模队列及验证队列。通过Lasso回归筛选候选变量,实现模型的降维和优化,防止过度拟合现象。纳入所有选择的变量,建立高血压人群心血管疾病发病的Cox回归模型和列线图模型。列线图模型的验证通过一致性指数(C-index)、校准度和受试者工作曲线(ROC)曲线下面积(AUC)来进行评估。将血压分级用于更新模型,并通过计算净分类改善指标(NRI)和综合判别改进指数(IDI)对原始模型和更新模型进行比较。3.基于NCRCHS研究建立的前瞻性队列研究,纳入基线无心血管疾病的高血压人群,随机抽取30例中位随访4.66年的心血管疾病发病病例。按照性别、年龄、血压分级和地域1:1匹配选取同期随访未发生心血管疾病的高血压患者作为对照组。对两组基线血浆样本采用超高效液相色谱-质谱方法分析代谢组学特征的差异。我们对整理好的数据进行主成分分析和正交偏最小二乘法-判别分析(即多元变量模式识别分析)。将Student’s t检验的P值小于0.05,同时OPLS-DA模型第一主成分的变量投影重要度(VIP)大于1作为筛选差异代谢的标准。应用富集分析和拓扑分析筛选出差异代谢物的代谢通路。筛选出ROC曲线下面积AUC>0.8的差异代谢物作为高血压人群心血管疾病发病的关联强度最强的一组代谢物。应用Logistic回归模型调整传统危险因素后进一步分析这些危险因素与高血压心血管疾病的关系。应用Pearson方法分析这些代谢物与临床指标(血压、血脂等)相关关系。结果:1.基线8723名高血压患者被纳入研究。高血压人群的心血管疾病患病粗率为13.7%(95%CI 13.0%-14.5%),随着血压升高、年龄增高,高血压心血管疾病的患病率分别逐渐升高。血压在130-139/80-89mm Hg之间的高血压参与者心血管疾病患病粗率为9.0%(95%CI 8.0%-10.2%)。其中女性高血压患者冠心病的患病粗率为7.6%,明显高于男性4.9%,两者存在统计学差异(P<0.001)。多因素Logistic回归分析显示,年龄、BMI、平均收缩压和平均舒张压每增加一个单位,高血压人群的心血管疾病患病风险增加(年龄:OR 1.052,95%CI 1.053-1.065;BMI:OR 1.026,95%CI 1.007-1.045;Mean SBP:OR 1.005,95%CI 1.001-1.009;Mean DBP:OR 1.010,95%CI 1.002-1.017)。糖尿病、Low HDL-C、High TG和High UA增加高血压人群心血管疾病患病风险(糖尿病:OR 1.320,95%CI 1.108-1.573;Low HDL-C:OR 1.245,95%CI 1.039-1.491;High TG:OR 1.222,95%CI 1.040-1.437;High UA:OR 1.352,95%CI 1.081-1.690)。饮酒、多吃鱼和瘦肉、从事中重度劳动强度的高血压患者心血管疾病患病风险降低。家族高血压病史、家族冠心病和家族脑卒中病史的高血压患者心血管疾病患病风险增高(家族高血压病史:OR 1.683,95%CI 1.449-1.954;家族冠心病病史:OR 1.524,95%CI1.286-1.807;家族脑卒中病史OR:1.489,95%CI 1.272-1.742)。2.建模队列(n=4055)与验证队列(n=2027)的基线特征相似。在纳入6082名高血压参与者中,331名参与者(5.4%)在中位随访4.66年期间发生心血管事件。采用Lasso法(当Lambda取一个标准误Lambda.1se时)筛选出9个自变量:性别、年龄、短暂性脑缺血发作(TIA)、糖尿病家族史、高血压家族史、中风家族史、肾小球滤过率(e GFR)、高-低密度脂蛋白胆固醇(LDL-C)和低血清镁,建立了列线图模型。并用血压分级更新了列线图模型。初始模型和基线血压更新模型在建模队列中的C-index分别为0.736(95%CI 0.706–0.766)和0.766(95%CI 0.737–0.795),在验证队列中分别为0.711(95%CI 0.665–0.757)和0.751(95%CI 0.707–0.795)。预测模型在建模队列和验证队列的AUC分别为:初始模型2年累积CVD发病风险的AUC在建模队列和验证队列分别为0.744和0.719;初始模型4年累积CVD发病风险的AUC在建模队列和验证队列分别为0.746和0.742;更新模型2年累积CVD发病风险的AUC在建模队列和验证队列分别为0.779和0.782;更新模型4年累积CVD发病风险的AUC在建模队列和验证队列分别为0.778和0.780。初始模型和更新模型的校准曲线均提示校准度较好。净重分类指数(NRI)和综合判别改善指数(IDI)均提示更新模型的重新分类更准确,模型性能更好。3.病例组(n=30)和对照组(n=30)的基线特征均无统计学差异。两组的基线血浆代谢物在正负离子合并模式下PCA分析和OPLS-DA分析均显示组间存在差异。应用OPLS-DA模型的VIP值>1且Student’s t检验的P<0.05作为筛选差异代谢物的标准,一共筛选出57种差异代谢物。找到36个代谢通路参与了高血压患者心血管疾病的发病,而其中7个为主要代谢通路,包括:D-精氨酸和D-鸟氨酸代谢途径(富集分析Raw P=0.077,拓扑分析影响因子(Impact)0.500)、氰基氨基酸代谢途径(Raw P=0.150,Impact 0.333);丙氨酸、天冬氨酸和谷氨酸代谢途径(Raw P=0.023,Impact 0.207);丙酮酸代谢途径(Raw P=0.276,Impact 0.183);精氨酸和脯氨酸代谢途径(Raw P<0.001,Impact 0.123);甘油磷脂代谢途径(Raw P=0.006,Impact 0.065);牛磺酸和低牛磺酸代谢途径(Raw P=0.016,Impact 0.022)。将57种差异代谢物进行ROC曲线分析,最后筛选出9种ROC曲线下面积AUC>0.8的显著差异代谢物,并调整传统心血管危险因素做Logistic回归分析,结果如下:7种显示与心血管疾病风险增加相关:4-羟基苯甲醛、N-环丙基-反式-2-顺式-6-壬二胺、十八胺、磷脂酰胆碱(16:0/16:0)、鞘磷脂(d16:1/24:1(15Z))、鞘磷脂(d18:0/18:1(9Z))和鞘磷脂(d18:1/20:0);2种代谢物与心血管疾病风险降低相关:(3xi,6xi)-环(丙氨酰戊酰基)和5-氨基咪唑核苷酸。9种差异明显的代谢物所构建的预测模型的AUC为0.969,95%CI 0.926-1.000。其中4-羟基苯甲醛与SBP显著相关(r=0.265,P<0.05),5-氨基咪唑核苷酸与DBP显著相关(r=0.335,P<0.05),磷脂酰胆碱(16:0/16:0)与DBP相关(r=-0.296,P<0.05),鞘磷脂(d16:1/24:1(15Z))与LDL-C显著相关(r=0.402,P<0.05)。结论:1.本研究首次报道了我国东北农村地区基于新的高血压定义130/80mm Hg诊断标准的高血压人群心血管疾病的患病率非常高,其中女性高血压人群冠心病的患病率高于男性。2.血压控制不佳、糖尿病、血脂异常、高尿酸血症和BMI增高均增加高血压人群心血管疾病的患病风险。3.基于传统心血管危险因素和临床生化指标的结合,并应用Lasso-Cox回归模型首次建立了一个新的预测模型和列线图来预测高血压人群心血管疾病发病的短期风险(2年和4年)。4.应用血浆非靶向代谢组学研究发现高血压心血管疾病发病的患者与未发病的患者具有血浆代谢谱的显著差异。5.从中筛选出9种对分组贡献大的差异代谢物和7个主要的代谢通路,9种代谢物组合可以很好的预测高血压心血管疾病的发生。