论文部分内容阅读
目的:建立乌鲁木齐市成人2型糖尿病发病风险模型并进行评估。方法:采用随机整群抽样的方式在乌鲁木齐市米东区和新市区分别抽取A社区卫生服务中心(A社区)和B社区卫生服务中心(B社区),于2018年7月至2019年1月分别在A社区和B社区招募年龄为35~74岁居民并进行问卷调查、体格测量、体脂检测和实验室检测。以A社区的研究数据作为训练集,在训练集中分别运用单因素Logistic回归和随机森林算法筛选变量,再应用多因素Logistic回归建立糖尿病发病风险模型,采用十折交叉验证对模型进行内部验证,再用B社区居民的研究数据对建立的糖尿病发病风险模型进行外部验证,通过受试者工作特征曲线下面积(AUC)和统计学检验模型预测值和实际观测值间的差异来分别评价模型的区分度和校准度。结果:在A社区和B社区最终分别招募1221名和1004名研究对象。通过B社区居民的研究数据对单因素logistic回归筛选变量后用多因素logistic回归(方法一)建立的糖尿病发病风险模型进行评估,其灵敏度为70.1%,特异度为64.6%,预测一致率为65.4%,AUC为0.717,95%CI(0.672,0.761);通过B社区居民的研究数据对随机森林算法筛选变量后用多因素logistic回归(方法二)建立的糖尿病风险预测模型进行评估,其灵敏度为70.1%,特异度为60.9%,预测一致率为62.4%,AUC为0.708,95%CI(0.664,0.749),两种预测方法AUC的差异无统计学意义,即两种预测方法的区分度无差别,区分度均较高。两种预测方法各自糖尿病发生的预测值和实际观测值的差异经Hosmer-Lemeshow(H-L)检验发现均无统计学意义,即两种预测方法均有良好的校准度;从模型预测值和实际观测值间的关系图上可同样看出,两种预测方法各自的校准度较好。结论:通过方法一和方法二建立的糖尿病发病风险模型,具有较高的预测效能,两种预测方法都具有较高的区分度和良好的校准度。