论文部分内容阅读
本文主要研究中国肺结核月发病人数的预测,以期为我国肺结核的控制工作提供相应的数据支持。根据月发病人数序列波动的周期特征,本文从序列分解的角度进行预测。首先,采用小波分析(WA)和奇异谱分析(SSA)对原始序列进行分解,提取序列周期。小波分析得到趋势序列、两个周期序列和残差序列。趋势序列和两个周期序列分别用极限学习机(ELM)和非线性滤波器(NAR)预测;残差序列用支持向量回归(SVR)预测。由此建立两个组合预测模型:WA-ELM-SVR和WA-NAR-SVR。SSA分解得到重构序列和残差序列,重构序列用ELM和NAR分别预测,残差序列用SVR预测,同样得到两个组合预测模型:SSA-ELM-SVR和SSA-NAR-SVR。根据组合预测模型,将小波分析的趋势序列、周期序列和残差序列的预测值加总或者将重构序列和残差序列的预测值加总,就得到肺结核月发病人数预测值。和基于原始序列建立的ELM和NAR模型相比,四个组合模型的预测效果较好,表明小波分析和SSA可以提取原始序列的周期,提高序列预测准确度。然后,考虑到肺结核月发病人数受到季节因素的影响,原始序列波动具有季节周期,具体在每一年中,1月~6月肺结核发病人数不断上升,7月~12月开始逐渐下降。因此采用Seasonal-Trend Decomposition using LOESS(STL)分解,将原始序列分解为季节指数、长期趋势和残差项。季节指数在不同年份保持固定不变,无需建立模型预测。用反馈神经网络(Elman网络)预测长期趋势,SVR预测残差项,建立STL-Elman-SVR预测模型。根据STL-Elman-SVR模型,同样将季节指数、长期趋势和残差项的预测值相加就得到最终月发病人数预测值。比较预测值和真实值,并建立对比模型STL-ARIMA和STL-GM(1,1),比较模型可知,STL分解可以准确提取稳定的季节指数,保证预测的准确性。本文将小波分析、SSA和STL分解方法引入发病人数预测中,运用机器学习算法预测分解分量,建立组合预测模型。根据组合模型所预测的肺结核发病人数高发月份,可以为我国完善肺结核预防措施提供定量依据。