基于ARIMA模型的标准普尔S&P500指数预测分析

来源 :现代商贸工业 | 被引量 : 0次 | 上传用户:wain155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:金融预测对于发现金融发展客观趋势、指导金融投资具有重要的现实指导意义。研究了应用ARIMA模型预测标准普尔S&P500指数。原始数据采集来源于Yahoo finace数据库,研究数据为标准普尔S&P500指数收盘价,数据范围为1990-1-3至2012-3-26,数据划分为建模数据与检验数据二部分。研究结果显示,预测模型为ARIMA(5,1,4)形式,模型预测平均精度为1.8%。研究结果可为金融投资提供理论实证参考。
  关键词:S&P500指数;ARIMA模型;预测分析
  中图分类号:F83 文献标识码:A 文章编号:16723198(2012)14010002
  1 引言
  自2007年美国发生金融危机以来,世界经济秩序发生了巨大的变化,全球经济增长陷入了停滞,有些国家甚至出现了负增长,尤其对于以出口导向为主的发展中国家影响更为明显,实体经济遭到沉重打击,制造业成本增加,利润减少,实体经济效益降低,刺激了相应第三产业的投资增加,其中金融行业的投资相应显现出增长趋势,而金融行业投资与实体经济投资具有明显差异,其中金融行业的不确定性因素相比实体经济而言更为复杂。因此,准确预测金融投资预期成为了当前股票、证券、期货等投资的研究热点领域。金融预测具有显著的实践指导意义,无论是投资者还是管理者,他们都迫切需要知道投资未来预期的变化趋势,以及未来的收益变化,这些变化均体现在金融数据的波动过程中,金融数据具有随机性、非线性等特征,这为准确预测带来不确定性。因此应用适当的数据工具、准确预测金融发展趋势具有重要的现实意义。针对金融时间序列数据的特性,本文拟以标准普尔500指数(即S&P500)作为研究对象,以差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA)作为研究工具,预测S&P500指数的变化规律。
  2 研究现状
  S&P500是全球最著名的篮筹股指数,相对NASDAQ指数和DOW Jones Industrial Average指数,S&P500指数无论是在市场代表性、衍生品等方面具有明显的优势。深刻理解及掌握S&P500指数的变化规律,对于正确评价美国经济趋势,跟踪世界经济发展源流,参与全球市场套利及定价,具有非常重要的现实意义。标准普尔500指数英文简写为S&P500 Index,是记录美国500家上市公司的一个股票指数。标准普尔500指数在资本市场上具有重要的参考作用,其在金融投资、管理等领域均具有非常重要的参考价值。基于标准普尔500指数在金融市场的重要地位,自发布之日起便受到金融、经济界的高度重视,对S&P500指数的预测研究引起了国内外研究学者的重视,国内研究成果分别有:以上证综指、恒生指数以及S&P500指数的高频数据作为研究对象,采用跳跃显著性检验方法和扩展HAR模型,对股票市场波动跳跃特征进行了实证研究(西村友作,2012),采纳神经网络模型建立股市预测模型,通过S&P500指数开盘价进行实例分析,与传统的时间序列分析和其他集成方法对比(赵世安,2011),运用方差方法/重标极差方法(R/S)和消除趋势波动分析方法(DFA)对美国股市标准普尔500指数的收盘价进行分析(2009,许娜),应用神经网络对S&P500短期走势进行预测,具体研究数据对象是从1998年3月20日至1999年4月26日S&P500的每周数据(王洪刚,2002)。国外研究的相关成果有:结合熵与LVQ网络、概率理论预测S&P500指数(Lahmiri,S.2012),采用时间序列预测应用局部学习算法预测S&P500指数(Metghalchi,M.2005)。通过分析国内外研究现状可知,当前对于S&P500指数的研究主要集中于对短期的预测,研究工具各不相同,本文在前人研究的基础上,采用差分自回归移动平均模型对S&P500指数进行长期预测。
  3 ARIMA原理
  3.1 基本原理
  ARIMA(p,d,q)模型全称为差分自回归移动平均模型,是由Box和Jenkins于1976年创立,其基本原理是将数据视为一随机序列,构造数学模型,以过去值和现在值预测未来数值。ARIMA(p,d,q)模型由两模型联合而成,即AR(p)模型和MR(q)模型,AR(p)即自回归模型,p表示回归项数,MR(q)模型为移动平均模型,q表示移动平均项数,ARIMA中的d表示差分阶数。
  AR(p)p价自回归可表示为:
  Yt-δ=a1(Yt-1-δ)+a2(Yt-2-δ)+…+ap(Yt-p-δ)+ut
  Ma(q)可表示为:Yt=μ+β0ut+β1ut-1+β2ut-2+…+βqut-q
  ARMA(p,q)的一般形式(其中θ为一常数项):
  Yt=θ+α1Yt-1+a2Yt-2+…+αpYt-p+β0ut+β1ut-1+…+βqut-q
  ARMA(p,d,q)则是ARMA(p,q)差分d阶模型。
  3.2 实施步骤
  (1)判断。在ARMA(p,d,q)模型中有三个参数p,d,q需要确定,在实际应用中需要首先判断数据序列是否是平稳序列。
  (2)估计。在ARMA(p,d,q)模型中参数p,q的确定,常借助相关图和偏相关图确定。
  (3)检验。检验ARMA(p,d,q)模型的拟合程度及可靠性,判断模型估计结果的残差是否存在白噪音,以便修正相关参数。
  (4)预测。使用通过检验的在ARMA(p,d,q)模型进行预测分析,并计算预测结果的准确度。
  ARIMA原理的更详细介绍请参见参考文献[6]。
  为了检验ARMA(5,1,4)模型的拟合程度及可靠性,判断模型估计结果的残差是否存在白噪音,可以通过ARMA(5,1,4)模型所生成的残差序列,确定最大滞后阶数为15,计算出残差序列的相关图和Q统计量。经检验发现,残差序列的样本自相关函数均在设定区域内,相应的概率误差均小于5%,因此可以判断残差序列不存在自相关,因此可以认为模型通过检验。   4.4 预测
  为检验模型的精度,本文将2012-2-27至2012-3-26五个星期的数据作为检验数据,检验预测精度,预测数值是2012-2-27至20123-26五个星期的S&P500指数,图3为预测结果及拟合图。
  从预测表可知,通过对2012-2-27至20123-26的S&P500指数进行计算预测,预测最大相对误差为3.25%,最大误差没有超过5%,平均相对误差为1.8%,因此可以认为所建模型是有效的。
  5 结语
  本文采用差分自回归移动平均模型建立金融时间序列预测模型。研究对象是美国S&P500指数,数据范围为1990-1-3至2012-3-26,数据划分为二部分,其中1990-1-3至20123-20区间数据用于建立模型,2012-2-27至2012-3-26区间数据用于检验,所建立的预测模型为ARIMA(5,1,4),经实际数据检验,模型的预测精度误差均小于5%,因此所建模型是有效且可用于实际应用,本文建立美国标准普尔S&P500指数预测模型具有实践指导意义。S&P500指数数据也与其它金融数据一样具有随机性,这为数据预测带来不确定因素,也增加了预测的难度,下一步的工作将结合其它非线性理论,形成组合预测模型,进一步提高预测精度。
  参考文献
  [1]国泰君安.S&P500——蓝筹股的摇篮,指数产品的良选[EB/OL].[2012329].http://www.bosera.com/minisite/market/2010/dbvisit/bg1.html.
  [2]西村友作,孙便霞,门明.全球金融危机下的股票市场波动跳跃研究——基于高频数据的中美比较分析[J].管理工程学报,2012,(01).
  [3]王洪刚,韩文秀.基于小波神经网络的S&P500短期走势预测[J].西北农林科技大学学报(社会科学版), 2002,(06).
  [4]Salim Lahmiri An entropy-LVQ system for S&P500 downward shifts forecasting[J].Management Science Letters,2012,(2):2128.
  [5]Massoud Metghalchi.Market Efficiency For S&P500:1954-2004[J].International Business & Economics Research Journal,2005,4(7):2330.
  [6](美)古扎拉蒂著,费剑平,孙春霞等译.计量经济学基础[M].北京:中国人民大学出版社,2005.
  [7]Yahoo finance[EB/OL].[2012327].http://finance.yahoo.com/q/hp?s=%5EGSPC+Historical+Prices.
  [8]樊欢欢等.Eviews统计分析与应用[M].北京:机械工业出版社,2011.
  4 实证分析
  4.1 数据采集
  原始数据采集于Yahoo finance(雅虎财经),采集的数据为每周数据,时间范围为1990-1-3至2012-3-26,共1160个S&P500指数数据,数据划分为二部分,其中1990-1-3至20123-20区间数据用于建立模型,2012-2-27至2012-3-26区间数据用于检验,原始数据折线图如下图所示:
  图1 原始数据折线图4.2 参数确定
  确定参数p,d,q并建立相应的ARIMA(p,d,q)模型。首先确定差分价数d。进行数据序列稳定性检验,经ADF检验,ADF检验统计值是-1.335859,大于10%的临界值-2.568038,原始数据存在单位根,为不平稳序列。经一阶差分后,ADF检验统计值是-37.05214,小于1%的临界值-3.435782,原始数据序列变为了平稳序列,因此数据序列为一价差分平稳序列,所以参数d=1。下图为一阶差分图:
  图2 原始数据一价差分折线图然后确定参数p,q。因为数据为一阶差分平稳序列,所以根据其自相关系数(ACF)图和偏相关系数(PACF)图可以判断,p,q的取值分别为5和4,即可构成ARIMA(5,1,4)模型。
  最后根据所确定的参数建立如表1所示的ARIMA(5,1,4)估计图。
其他文献
随着我国经济的高速发展以及社会文明的不断进步,我国的企业取得了较为显著的发展和进步,为我国的社会主义现代化建设作出了重要贡献。但是由于经济体制的改革以及市场竞争压力
多年统计数据表明,铁路设备管理单位在现场作业中,作业人员被车辆伤害或因为在线上作业未及时下道,造成司机被迫停车是铁路惯性多发事故,在人身安全事故原因统计中,车辆伤害
对江西银山地区双桥山群绢云母千枚岩及其原岩的稀土及微量元素的研究表明,热液蚀变过程中它们的地球化学行为十分复杂:热液蚀变作用并不使REE淋滤降低,反而导致ΣREE较其原
运用博弈分析的方法具体分析了不同情况下的两条供应链之间的博弈关系,并在此基础上提出了加快安徽省汽车产业供应链的政策建议。
跨国公司通过群居生存、通过全球协议伙伴,使各自能力得到系统的放大.在教育领域亦可如此.我国的教育需要像跨国公司那样,应有许多的'教育协议伙伴',最终形成一种多
<正>课程改革走到今天,课堂生态发生了巨大变化,情境式教学、探究式教学、体验式教学的普遍运用,给课堂教学注入新的生机与活力。但是,在思想政治课教学实践中,在学生学科核