论文部分内容阅读
摘要:对气象时间序列数据合理利用及预测,能够为气象行业预防灾害提供现实依据。本文将北京市1996年到2015年月平均气温数据构建模型,并以2016年数据进行验证,效果较好,表明时间序列分析方法在气温预测方面有较好的应用。
关键词:时间序列;气温;平稳;SARIMA
1、引言
精确的气象预报可以为国民经济建设提供更好服务,也能够降低由气象灾害造成的损失。因而,能够说精准适时的气象预报对我们生命财产安全、生活条件等方面具有重大的社会效益和经济效益。
2、SARIMA模型概述
SARIMA模型又叫季节性差分自回归移动平均模型。此模型的基本构成为SARIMA(p,d,q)(P,D,Q),共六个参数需要确定。其中P、D、Q主要描述季节性的变化,p、d、q用来描述去除季节性的变化。
3、数据来源
本文研究的数据来自中国统计年鉴,以气温、月份为变量。运用时间序列分析方法来分析研究1996-2016年北京市月平均气温数据。
4、对北京市月平均气温建立时间序列模型
4.1时间序列的预处理
对北京市月平均数据做时间序列图,如图1(左)所示,可以看出该序列周期波动。作数据自相关系数图和偏相关系数图如图1(中)和图1(右),由此可以看出序列为非平稳状态,具有明显的周期为12的周期性,所以需要对此序列进行季节差分,从而转换为平稳序列。
4.2模型识别
根据时序图显示出以年为周期的季节波动,对此序列实行差分运算直到转化成平稳时间序列。其差分后序列的时序图可见图2(左)。
检验差分后序列检验平稳性,季节差分运算后的序列是平稳的。从差分后的自相关图(图2中)和偏相關图(图2右)可以判断差分后的数据为非白噪声,故可以用SARIMA模型建模。
4.3参数估计
模型识别之后,便可对模型进行初步定阶。不难确定d=0,D=1。对于p,q,P,Q的可能取值,根据AIC准则来确定最终的最优模型的参数。本文经过筛选,最优模型为SARIMA(4,0,4)(0,1,1)[12]模型。系数如表1:
4.4模型诊断与检验
经过对回归系数的显著性检验,所有系数都显著。对残差做单位根检验和白噪声检验,进行单位根检验的P值小于0.01,拒绝原假设,残差序列不含单位根,序列平稳;白噪声检验的P值为0.9772,接收原假设,残差序列平稳。模型通过检验。
4.5模型预测结果及分析
用得到的ARIMA(4,0,4)(0,1,)[12]模型对北京市月平均气温数据时间序列进行预测结果见表2,从表中可以看出实际温度非常接近,并且预测温度都在95%置信区间内,该模型的预测准确性较高。
4.6模型评价
依据以上能够看出,模型的拟合效果与预测结果较好。该模型相对比较简单,只仅仅需要变量本身的历史数据,其有着十分广泛的实用性。
5结论
本文对北京市月平均气温建立的时间序列模型能够很好地模拟了气温序列趋势,同时经过2016年实测水温数据的验证,表明SARIMA模型的预测效果较为理想。
参考文献:
[1]王莹,韩宝明,张琦,等.基于SARIMA模型的北京地铁进站客流量预测[J].交通运输系统工程与信息,2015(06):205-211
[2]王燕.时间序列分析—基于R[M].北京:中国人民大学出版社,2015
[3]何书元.应用时间序列分析[M].北京:北京大学出版社,2003.
关键词:时间序列;气温;平稳;SARIMA
1、引言
精确的气象预报可以为国民经济建设提供更好服务,也能够降低由气象灾害造成的损失。因而,能够说精准适时的气象预报对我们生命财产安全、生活条件等方面具有重大的社会效益和经济效益。
2、SARIMA模型概述
SARIMA模型又叫季节性差分自回归移动平均模型。此模型的基本构成为SARIMA(p,d,q)(P,D,Q),共六个参数需要确定。其中P、D、Q主要描述季节性的变化,p、d、q用来描述去除季节性的变化。
3、数据来源
本文研究的数据来自中国统计年鉴,以气温、月份为变量。运用时间序列分析方法来分析研究1996-2016年北京市月平均气温数据。
4、对北京市月平均气温建立时间序列模型
4.1时间序列的预处理
对北京市月平均数据做时间序列图,如图1(左)所示,可以看出该序列周期波动。作数据自相关系数图和偏相关系数图如图1(中)和图1(右),由此可以看出序列为非平稳状态,具有明显的周期为12的周期性,所以需要对此序列进行季节差分,从而转换为平稳序列。
4.2模型识别
根据时序图显示出以年为周期的季节波动,对此序列实行差分运算直到转化成平稳时间序列。其差分后序列的时序图可见图2(左)。
检验差分后序列检验平稳性,季节差分运算后的序列是平稳的。从差分后的自相关图(图2中)和偏相關图(图2右)可以判断差分后的数据为非白噪声,故可以用SARIMA模型建模。
4.3参数估计
模型识别之后,便可对模型进行初步定阶。不难确定d=0,D=1。对于p,q,P,Q的可能取值,根据AIC准则来确定最终的最优模型的参数。本文经过筛选,最优模型为SARIMA(4,0,4)(0,1,1)[12]模型。系数如表1:
4.4模型诊断与检验
经过对回归系数的显著性检验,所有系数都显著。对残差做单位根检验和白噪声检验,进行单位根检验的P值小于0.01,拒绝原假设,残差序列不含单位根,序列平稳;白噪声检验的P值为0.9772,接收原假设,残差序列平稳。模型通过检验。
4.5模型预测结果及分析
用得到的ARIMA(4,0,4)(0,1,)[12]模型对北京市月平均气温数据时间序列进行预测结果见表2,从表中可以看出实际温度非常接近,并且预测温度都在95%置信区间内,该模型的预测准确性较高。
4.6模型评价
依据以上能够看出,模型的拟合效果与预测结果较好。该模型相对比较简单,只仅仅需要变量本身的历史数据,其有着十分广泛的实用性。
5结论
本文对北京市月平均气温建立的时间序列模型能够很好地模拟了气温序列趋势,同时经过2016年实测水温数据的验证,表明SARIMA模型的预测效果较为理想。
参考文献:
[1]王莹,韩宝明,张琦,等.基于SARIMA模型的北京地铁进站客流量预测[J].交通运输系统工程与信息,2015(06):205-211
[2]王燕.时间序列分析—基于R[M].北京:中国人民大学出版社,2015
[3]何书元.应用时间序列分析[M].北京:北京大学出版社,2003.