论文部分内容阅读
研究目的:本研究基于2009-2016年重庆市细菌性痢疾(Bacillary dysentery,BD)的时空分布特征分析、气象因子对重庆市BD的发病效应分析,以及多种BD发病率预测模型的构建与评价,掌握疾病流行现况,探索可能影响其发病的关键气象因子,确定其脆弱人群,并探讨气象因子对于提高模型预测精度的重要性,旨在为重庆市BD疫情的防控提供科学依据,并为其它传染性疾病的预测提供一个高效、合理的分析与建模思路。研究方法:1收集整理2009-2016年重庆市BD疫情监测数据、人口及气象因子数据,采用描述性流行病学技术与时空扫描统计量(Spatial-temporal scan statistics),分别分析BD的三间分布特征与发病的时空聚集性。2采用分布滞后非线性模型(Distributed lag non-linear model,DLNM)探讨各气象因子与人群BD发病的关联性,用以估计气象因子对重庆市BD发病的可能干预效应。3运用Boruta算法结合粒子群优化算法(Particle swarm optimization,PSO)以及支持向量机回归模型(Support vector machine for regression,SVR)、长短时记忆神经网络(Long-short term memory,LSTM)建立BD发病率预测模型,并采用均方根误差(Root mean square error,RMSE)、平均绝对误差百分比(Mean absolute percentage error,MAPE)、平均绝对误差(Mean absolute error,MAE)评价模型的预测性能,以探讨气象因子对于提高模型预测性能的重要性。结果:1 BD时空分布特征2009-2016年重庆市累计报告BD病例数为68 855例,年均发病率为29.394/10万(发病率范围:36.312/10万-23.613/10万),发病率整体呈下降趋势。BD男女平均发病率分别为31.002/10万与27.724/10万,发病率之比为1.130:1。0-5岁人群发病率最高(295.892/10万),散居儿童占比最大(34 658例,50.335%),5-10月为其发病高峰(45 131例),占全年发病例数的65.545%。BD时空聚集性分析结果显示,2009-2016年重庆市BD一类聚集区主要集中在重庆市主城区,二类聚集区主要集中在渝东北地区,6-10月为其主要的发病聚集时间。2气象因子影响BD发病的效应评估2.1气象因子与BD发病的总体关联情况重庆市日平均气温、日平均气压和日平均水汽压与BD日发病人数均呈非线性关系,且存在强烈的即时效应。当日平均气温为36.5℃、滞后0天时,相对危险度(Relative risk,RR)值最大,为1.11(95%CI:1.07~1.14);当日平均气压为961.5 hPa、滞后0天时,RR值最大,为1.07(95%CI:1.03~1.10);当日平均水汽压为35 hPa、滞后0天时,RR值最大,为1.13(95%CI:1.08~1.17)。在30天滞后时间内,当日平均气温达最高值36.5℃时,累积相对危险度(Cumulative relative risk,CRR)值最大,为2.65(95%CI:2.19~3.21);当日平均气压为最低值961.5 hPa时,CRR值最大,为3.21(95%CI:2.50~4.11);当日平均水汽压为最高值35 hPa时,CRR值最大,为1.98(95%CI:1.59~2.47)。2.2气象因子影响BD发病的极端效应与累积极端效应日平均气温极高值(32℃)滞后0天时,高温效应RR值最大,为1.10(95%CI:1.07~1.13),其滞后效应可持续约10天。日平均气压极低值(970 hPa)滞后0天时,低气压效应RR值最大,为1.05(95%CI:1.03~1.06),其滞后效应持续可超过30天。日平均水汽压极高值(28 hPa)滞后0天时,高水汽压效应RR值最大,为1.09(95%CI:1.06~1.12),持续约10天。日平均气温极低值(7℃)、日平均气压极高值(997 hPa)、日平均水汽压极低值(8 hPa)对人群BD的发病效应均无统计学意义。日平均气温极高值、日平均气压极低值、日平均水汽压极高值在其最大滞后天数内对BD发病的累积极端效应的CRR值分别为1.79(95%CI:1.58~2.02)、2.20(95%CI:1.91~2.53)与1.54(95%CI:1.37~1.74);日平均气温极低值、日平均气压极高值、日平均水汽压极低值的累积效应均无统计学意义。2.3日平均气温影响BD发病的性别、年龄差异日平均气温对女性的高温效应大于男性,对15-64岁人群高温效应大于其他年龄人群。高温效应的滞后时间在不同性别,年龄层人群中也存在差异,其中男性约为13天,女性约为10天,0-14岁人群约为20天,15-64岁人群约为10天,65岁及以上人群约为3天。日平均气温的低温效应对各人群的发病影响均无统计学意义。日平均气温的累积高温效应在0-14岁人群中最大,为2.19(95%CI:1.83~2.60),其次是在女性人群中,为1.98(95%CI:1.69%~2.31%)。重庆市2009-2015年日平均气温对总人群BD发病效应的归因分值(Attributable fraction,AF)为24.99%(95%CI:22.12%~27.54%),其中高温(日均气温>11℃)的AF值为25.63%(95%CI:22.83~28.41),低温(日均气温<11℃)的AF值为-0.65%(95%CI:-1.33%~-0.05%)。高温对0-14岁人群BD发病效应的AF值最大,为37.13(95%CI:33.84%~39.92%),低温的AF值无统计学意义。3 BD发病率预测模型的构建与评价3.1 BD月发病率预测的模型构建与效果评价基于气象因子构建的BD月发病率预测模型PSO_SVR_MONTH的RMSE、MAPE、MAE分别为0.299、0.104、0.237;与自变量不含气象因子的BD月发病率预测模型SVR_MONTH相比,其RMSE、MAPE、MAE分别下降40%、44%、43%。同样,基于气象因子构建的BD月发病率预测模型LSTM_MONTH的RMSE、MAPE、MAE分别为0.177、0.067、0.144;与自变量不含气象因子的BD月发病率预测模型LSTM_MONTH1相比,其RMSE、MAPE、MAE分别下降22%、14%、22%。3.2 BD周发病率预测的模型构建与效果评价基于气象因子构建的BD周发病率预测模型PSO_SVR_WEEK(时间点=5)的RMSE、MAPE、MAE分别为0.069、0.101、0.055;与自变量不含气象因子的BD周发病率预测模型SVR_WEEK(时间点=5)相比,其RMSE、MAPE、MAE分别下降29%、30%、29%。同样,基于气象因子构建的BD周发病率预测模型LSTM_WEEK(时间点=5)的RMSE、MAPE、MAE分别为0.072、0.108、0.057;与自变量不含气象因子的BD周发病率预测模型LSTM_WEEK1(时间点=5)相比,其RMSE、MAPE、MAE分别下降33%、41%与37%。研究结论:1 2009-2016年重庆市BD疫情形势仍较为严峻,相关卫生部门应将重庆市主城区及渝东北作为疾病重点防控区域,同时应考虑结合气象因子与BD发病的密切关联性及其季节性高发特点,对0-5岁、散居儿童、农民、女性等重点人群,采取针对性的应对措施,以最大限度控制疾病的传播与流行。2基于气象因子构建的BD月发病率及周发病率预测模型,均具有良好的预测精度;气温、气压、水汽压等气象因子是BD发病率预测模型的重要相关特征集合,能明显提高模型的预测精度。该成果应能作为BD研究的一个范本,为重庆市BD疫情的防控、卫生资源的即时合理配置,提供科学的理论与技术支撑;同时也可为其它传染病(如:手足口,流感等)提供一个更为完整的研究思路与框架。