论文部分内容阅读
研究背景急诊就诊量增加以及急诊有限医疗资源供需的不平衡会导致了急诊拥挤,急诊拥挤会造成医疗。准确的急诊预检分诊系统一定程度上可以按照患者的病情更合理地安排有限的空间和医疗资源,缓解急诊拥挤。目前的我国急诊预检分诊体系的准确性仍有待提高。近年来许多研究表明机器学习能比基于分诊信息建立的单一模型展示出更高的预测能力。本研究通过机器学习算法,以急诊患者预后为研究终点事件,构建和验证人工智能分诊模型。目的探讨利用急诊预检分诊数据构建和验证不同机器学习模型和传统Logistic模型对急诊科成年患者临床预后结局的预测价值。方法回顾性分析广州医科大学附属第二医院急诊科2019年3月至2020年11月期间就诊患者共179,755例。排除了年龄<18周岁患者48,050例,关键数据缺失(患者就诊ID、病情分级)患者20例,退号患者5,135例,患者ID号重复共3例,最终纳入研究患者共126,547例。从医院信息系统(HIS)提取患者临床资料:临床特征、生命体征、病情分级、诊断,医疗资源占用的数量和急诊停留时间。根据患者去向分为:离院、7天内住院、紧急手术、ICU、死亡。主要研究研究结局为重症结局,次要研究结局为住院结局。根据重症结局和住院结局分别按1:4和1:1最近邻匹配法进行倾向性评分匹配,构建新数据集进行机器学习分析。将数据随机分成70%用于训练集和30%用于测试集,在随机抽样的训练集中根据所纳入预测因子建立3种机器学习模型:极限梯度提升模型,支持向量机模型,神经网络模型。根据急诊预检分诊的分诊等级使用传统方法Logistic回归建立参考模型。在测试集,使用受试者工作特征曲线下面积(AUC)、重分类改善指数(NRI)和混淆矩阵结果对比不同机器学习模型与Logistic模型的预测性能。结果在研究队列中,年龄段为18至44岁患者占比最大,共56,235(44.4%)例,其次为45至64岁患者,共34736(27.4%)例。成年男性60,654(47.9%)例,女性65,893(52.1%)例;在患者去向方面,转入ICU患者1,342(1.1%)例,死亡患者495(0.4%)例,急诊手术患者202(0.1%)例,入普通病房住院患者12,304(9.7%)例,离院患者112,204(88.7%)例;在生命体征方面,体温正常患者110,204(87.1%)例,脉搏正常患者101,425(80.1%)例,血压正常患者84,003(66.4%)例,呼吸正常患者125627(99.2%)例,血糖正常患者124310(98.2%)例,血氧饱和度正常患者124813(98.6%)例;急诊患者就诊后辅助检查资源占用情况分析,其中有47,770(37.8%)例患者接受血常规检查,为最常选择的检验项目,其次为肝功能检验项目,共13,289(10.5%)例;在影像学检查方面,CT检查为9,607(7.6%)例,为最常选择的检查项目,X线检查为9,817(1.7%)例;在疾病分类方面,其中第一诊断ICD-10编码归类为“症状、体征和临床与实验异常所见,不可分类于他处者”占比最大为52,520(41.5%)例,其次为“呼吸系统疾病”19,584(15.5%)例;按分诊级别划分,III级患者占比最多,共78,928(62.4%)例,其次为IVa级患者39,766(31.4%)例,II级患者7,155(5.7%)例,代表病情最重的I级患者557(0.4%)例,IVb级患者141(0.1%)例。经过倾向性评分匹配后建立重症监护组患者共10,195例和住院组患者共28,686例。在重症监护组中,按年龄划分占比最大的年龄段为65-79岁患者,共3,563(34.9%)例;女性患者6,382(62.6%)例;分诊级别为III级的患者6,456(63.3%)例;来源方式为步行的患者6,809(66.8%)例;就诊科室为急诊内科的患者7,631(74.8%)例;血压为正常范围的患者4,805(47.1%)例;接受血常规化验的患者4,398(43.1%)例;接受CT检查的患者1,565(15.4%)例;第一诊断为呼吸系统疾病的患者1,295(12.7%)例。在住院组中,按年龄划分占比最大的年龄段为65-79岁患者,共9,468(33.0%)例;女性患者15,882(55.4%)例;分诊级别为III级的患者19,198(66.9%)例;来源方式为步行的患者19,837(69.2%)例;就诊科室为急诊内科的患者20,958(73.1%)例;血压为正常范围的患者13,707(47.8%)例;接受血常规化验的患者13,109(45.7%)例;接受CT检查的患者5,546(19.3%)例;第一诊断为呼吸系统疾病的患者3,173(11.1%)例。在重症监护结局中,与Logistic模型(AUC=0.91,95%CI:0.90-0.92)相比,极限梯度提升模型(AUC=0.92,95%CI:0.91-0.93)的AUC值更高,但其差异无统计学意义(P=0.14),故其预测性能较Logistic模型无提高。在模型预测人数分析中,极限梯度提升模型在I至II级患者中相比起Logistic模型的过度分诊情况得到改善。在III级患者中极限梯度提升模型在一定程度上减少了过度分诊与分诊不足。在住院结局中,与Logistic模型相比(AUC=0.80,95%CI:0.79-0.81),极限梯度提升模型(AUC=0.82,95%CI:0.81-0.83)表现出更高的预测能力,差异有统计学意义(P=0.01)。在模型预测人数分析中,极限梯度提升模型在I至II级患者中相比Logistic模型的过度分诊情况得到改善。在III级患者中一定程度上减少了过度分诊与分诊不足。总体而言,极限梯度提升模型通过减少过度诊和分诊不足,相比Logistic模型获得了更好的预测结果。结论在重症监护结局中,极限梯度提升模型似乎对预后有较好的预测价值。在住院结局中,极限梯度提升模型通过减少III级患者的过度分诊和分诊不足,表现出更高的预测性能。