论文部分内容阅读
研究背景:2019年国际糖尿病联盟(International Diabetes Federation,IDF)发布的最新报告显示:糖尿病(Diabetes mellitus,DM)的发病率在逐年上涨,从2009年的2.85亿增至2021年的5.37亿,预计在2030年增至5.78亿,2045年增至6.93亿,成为继心脑血管和肿瘤疾病之后的第三个严重影响人体健康的慢性非传染性疾病。DM的一系列并发症在降低患者的生活质量的同时也为患者及其家庭带去了较大的经济压力。因此,DM患者需要进行自我血糖监测(Self-monitoring of blood glucose,SMBG),将血糖控制在正常范围内,对降低DM并发症的发生至关重要。目前,血糖监测技术日趋成熟,利用机器学习算法预测血糖成为了研究的热点之一。机器学习算法主要包括线性算法、非线性算法等,其中长短期记忆网络(Long-Short term memory,LSTM)与门控循环单元(Gate recurrent unit,GRU)属于非线性算法之一,LSTM具有较高的预测精度,但其复杂的内部结构降低了模型的训练速度,而GRU具有训练时间短的特点。因此,部分学者尝试将LSTM与GRU组合在一起,用于情感分析、交通流预测等领域,不仅提高了模型精度,也相对降低了模型运行时间。基于LSTM和GRU模型的工作原理相似,两个模型各有不足,本研究尝试将两者组合在一起,建立LSTM-GRU模型进行血糖预测,比较其与LSTM、GRU和灰度模型(Grey model,GM(1,1))在不同预测时间下的预测性能。在此基础上,运用LSTM-GRU模型进行低血糖预警,探究影响该模型预警性能的主要因素,对减少低血糖事件的发生具有一定的临床价值。目的:1.比较LSTM、GRU、GM(1,1)和LSTM-GRU模型在不同预测时间下的血糖预测性能。2.探究LSTM-GRU模型的低血糖预警性能及其主要影响因素。方法:1.回顾性分析2017年3月至2017年12月于河南省人民医院内分泌科住院期间接受皮下胰岛素泵治疗的100例DM患者的血糖信息。由于患者和医生至少需要15min来调整治疗方案,且每5min的血糖预测误差变化较小,因此,本研究以15min、30min、45min和60min为时间切点,运用LSTM、GRU、GM(1,1)和LSTM-GRU模型进行血糖预测,分别得到每种模型在不同时间下的血糖预测值,并计算每个预测的血糖值与动态血糖监测系统(continuous glucose monitoring system,CGMS)实测值的预测误差。对CGMS实测值与模型预测值进行相关性分析及克拉克误差网格分析,并比较四种模型的训练时间长短,用以评估模型预测性能。由于均方根误差(Root Mean Square Error,RMSE)能够避免出现量纲问题,针对异常值较敏感。因此,本研究采用RMSE作为评价指标,采用重复测量方差分析比较四种模型在不同时间下的预测误差有无统计学差异。如有统计学差异,比较四种模型分别在15min、30min、45min和60min的预测误差大小,结合统计学分析结果及误差大小,可以得到四种模型中最佳的血糖预测模型;如没有统计学差异,则说明四个模型在不同时间下的预测误差无差异。2.将3.9mmol/l作为低血糖阈值,根据LSTM-GRU模型前一部分预测的血糖值,对模型预测的低于3.9mmol/l的血糖值立即发出低血糖警报,并设置不同的低血糖区间进行分区预警。根据模型预测的血糖值是否为低血糖和CGMS实测值是否为低血糖的关系,计算模型的预警灵敏度、假阳性率、假阴性率、特异性和准确度。灵敏度是评价模型正确预警低血糖事件的主要指标之一。采用重复测量方差分析比较15min、30min、45min和60min的灵敏度有无统计学差异。利用ROC曲线探究影响LSTM-GRU模型预警性能的主要因素。结果:1.四种模型的预测值与实测值相关性显著(R>0.5,P<0.001)。LSTM-GRU模型的相关系数(correlation coefficient,R,R=0.995)不随预测时间的延长而降低,且相同时间下均高于GM(1,1)模型,而LSTM、GRU模型的R值在30min后逐渐降低。同一预测时间下,LSTM-GRU模型在A+B区的占比高于LSTM、GRU和GM(1,1)模型。GRU和LSTM-GRU模型训练时间最短,LSTM模型次之,GM(1,1)模型的时间最长。随着预测时间的横向延长,LSTM、GRU和GM(1,1)模型的RMSE逐渐增加,LSTM-GRU模型的RMSE在30-60min内趋于平稳。LSTM-GRU模型、GM(1,1)模型的RMSE与LSTM模型、GRU模型的RMSE分别在不同预测时间下具有统计学差异(均P<0.001);LSTM-GRU模型和GM(1,1)模型的RMSE在不同预测时间下具有统计学差均异(均P<0.001);LSTM模型和GRU模型的RMSE在不同预测时间下没有统计学差异(均P>0.05)。同一预测时间下,LSTM、GRU和GM(1,1)模型的RMSE均高于LSTM-GRU模型;同一预测误差下,LSTM-GRU模型的预测时间范围长于LSTM、GRU和GM(1,1)模型。综上结果,LSTM-GRU模型在四种模型中具有最好的预测性能。2.LSTM-GRU模型在30min、45min和60min的预警灵敏度无统计学差异。模型的预警灵敏度和假阴性率在30min后基本趋于平稳,随着预测时间的延长,模型的假阳性率、特异度和准确度基本保持稳定,显示出良好的预警性能,故选取60min为预警的时间节点。随着阈值的增加,LSTM-GRU模型的灵敏度增加,特异性降低,随着预测时间的延长,预警的准确性降低。结论:1.LSTM-GRU模型在不同时间下的预测性能均优于LSTM、GRU和GM(1,1)模型,且在30-60min内的预测性能趋于平稳。2.LSTM-GRU模型在60min内保持良好的预警性能,预测时间范围和阈值是影响低血糖预警的主要因素。