论文部分内容阅读
[摘 要] 本文利用连续的股指期货指数5分钟高频数据,基于“已实现” 波动率进行实证研究,结果表明股指期货“已实现” 波动率序列的分布是非正态分布且具有长记忆性,最后建立ARFIMA模型,并对波动率进行预测,预测平均误差7.20%。
[关键词]ARFIMA模型 高频数据 已实现波动率 预测
1 引言
随着金融市场的不断发展与扩容,对金融数据、特别是高频数据的研究已经成为实业界和学术界的热点问题和难点问题。本文在借助ARFIMA模型的基础上,对连续的期指指数(IF8888)波动率进行预测实证研究。在如今的经济领域中,时间序列的自相关函数缓慢衰减,而常用的模型AR 模型、MA模型及ARMA 模型,通常表现为短记忆性,属于线性平稳模型,难以刻画日益复杂的金融市场。因此如何表现金融资产的长记忆性成为当前学术界关注的焦点。
自从 Granger 和 Joyeux(1980)将长记忆性的概念引入经济学中,长记忆性的研究得到了飞速的发展。在当前的学术文献中,时间序列长记忆性的存在性得到了比较严谨的验证(Geweke & Porter-Hudak,1984; SDerek Bond,2007;陈璞和郑术专,2006;雷鸣,2007)。而在对时间序列长记性的模型研究上,学术界还未达成统一意见。目前存在接受度较高的模型有FDG模型(Granger,1980)、ARFIMA模型(Hosking,1981)、不对称长记忆随机波动模型(A-LMSV)(Ruiz & Veiga,2007)和ARFIMA-FIGARCH 模型(Sang Hoon Kanga,Seong-Min Yoonb,2007)。其中ARFIMA模型不仅能刻画时间序列的长记忆性和短记忆性,而且在高频数据中拟合效果较好。
高频数据由于其交易间隔不等、交易价格不连续以及呈现日内“U”型模式等特点,导致对高频数据的研究变得较为困难。Andersen和Bollerslev(1998)提出了一种基于高频数据全新的非参数波动率度量方法——已实现波动率(Realized Volatility,RV),它的成功推出极大地推动了金融高频数据波动率的研究进展。Koop, Jungbacker 和 Hol(2005)构建了拓展形式的SV模型(SV-RV模型)和ARFIMA模型(ARFIMA-RV 模型),并进行实证检验分析发现已实现波动率的引入可以极大提高传统波动率模型的预测能力。准确度量高频数据的波动率是为了预测,本文以中国连续的期货指数高频数据为样本,基于已实现波动率,建立ARFIMA模型对高频数据波动率进行预测分析。
2 模型介绍
2.1 高频已实现波动率模型
Anderson 和 Bollerslev(1998)首次提出已实现波动率(Realized Volatility,RV),是通过加总某一频率下的日内分时数据的收益平方来得到真实波动率的一个非参数估计,在日内频率选取适当的情形下,“已实现”波动率是真实波动率的无偏、 有效且一致的估计量, 它没有经典算法所带来的时间滞后。
2.2 ARFIMA模型
如果收益率时间序列具有长期记忆性, 则意味着收益是可预测的,长记忆性的存在使得资本市场的行为变得非常复杂, Granger & Joyeus(1980), Hosking等(1981) 分别将分数差分噪声(FI)和ARMA模型相结合提出了ARFIMA模型来描述长记忆过程。
研究发现,对数据进行整数阶差分往往会造成过度差分,将会滤掉序列在低频处的成分,使模型的精度降低, 为解决这一问题, Granger和 Hosking推导出了可以描述序列长记忆性特征的分数阶差分方程ARFIMA。
3 实证分析
3.1 数据选取
本文选取连续的期货指数IF8888在2011年1月4日至2016年8年26日之间的每隔5分钟交易数据的收盘价为样本,排除节假日等一些因素等的影响,共1375天的数据,平均每天54条。选取5分钟交易数据主要是因为吴有英等(2010)提出沪深300最优时间間隔为5分钟,能有效降低市场微观摩擦引起的价格上下跳跃,降低RV的估计偏差。
3.2 已实现波动率统计特征
通过计算样本已实现波动率和日内收益率的均值、方差、偏度、峰度、以及JB统计量,可以发现已实现波动率是非正态,具有严重的偏斜和尖峰厚尾现象,按每日收盘价计算的绝对收益率呈现均值回归和聚集效应,即收益率在0附近波动,并且一个大的价格波动率后面紧跟着一个大的价格波动,一个小的价格波动率后面紧跟着一个小的价格波动,这也说明了股指期货的收益率变化具有明显的非线性特征。
3.3 长记忆性检验
从图一中可以看出,股指期货高频数据存在明显的日内效应,即日内呈现周期性波动,这与我国股指期货市场非连续交易、询报价等市场微观结构因素有关。从图二可以发现已实现波动率存在长记忆性,在滞后80期后自相关函数才衰减为0。
3.4 ARFIMA计量模型
3.4.1 计算d值
因为已实现波动率取对数值后更接近于正态分布,所以看作是可观测变量,有显著的长期记忆性,用ARFIMA模型来刻画。模型如下:
利用Matlab软件,通过R/S分析法可以求出已实现波动率的Hurst指数, 然后通过d=H-0.5的关系式求出分数差分系数d,表1为计算结果。
从上表中可以计算出d值为0.03056,大于0,小于0.5,表明该5分钟级别的已实现波动率呈现为长记忆性特点。
3.4.2 去除长记忆性——分数差分推导及其运用
对于原始序列{Xt} ,可用下列公式表示对其进行d阶差分 ,其中 L为滞后算子 。差分后的序列记为{Wt}。为了方便计算,不失一般性 ,设 X0=0
本文对对数已实现波动率进行分数差分,除去长记忆性,得到短记忆的时间序列:
从表三中可以看出去除长记忆性的时间序列仍然存在尖峰后尾右偏现象,并且Jarque-Bera统计量在1%的置信水平下显著,拒绝原假设,认为样本不存在概率服从正态分布。
3.4.3 确定滞后阶数
对于时间间隔为 5分钟的对数 “已实现” 波动率序列,建立 AR(1),AR(2),AR(3), MA(1), MA(2),MA(3), ARMA(1,1), ARMA(1,2),ARMA(2,2) 等模型, 删除参数不显著的模型, 再选择AIC值和SBC值最小者为最优模型。实证研究表明对于分数阶差分后的对数 “已实现”波动率序列最合适的预测模型是ARMA(1,1)。通过参数估计,最终得到最优的ARFIMA(1,0.0356, 1)模型为:
3.4.4 模型预测
利用ARFIMA(1,0.0356, 1)模型对2016 年8 月15日到8 月26日的已实现波动率进行验证。其中最高误差在9.45%,其平均误差为7.20%,预测结果误差在可接受的范围内,对股指期货投资者有一定的借鉴作用。
4 结束语
本文以连续的股指期货高频数据为样本,在采用5分钟最优的时间间隔降低高频数据的跳跃性,基于已实现波动率,验证了股指期货价格波动呈现长记忆性,因此针对已实现波动率建立ARFIMA模型,得到最优模型ARFIMA(1,0.0356, 1),并利用该模型对已实现波动率进行预测,最高误差在9.45%,其平均误差为7.20%。
参考文献:
[1]陈璞,郑术专.长记忆时间序列的检验方法及对上证指数长记忆性的实证分析[J].科技应用,2006.
[2]雷鸣,缪柏其.存款序列的长记忆实证研究[J].数理统计与管理. 2007(Vol.26.No.4).
作者简介:
杨若一(1984- ),男,汉族,河北馆陶,主任,学士,四川天麓量化技术与创业研究中心,量化投资与量化交易;
胡冰霜(1958- ),女,汉族,山东聊城,教授,博士,四川大学社会学与心理学系,人工智能与量化投资。
[关键词]ARFIMA模型 高频数据 已实现波动率 预测
1 引言
随着金融市场的不断发展与扩容,对金融数据、特别是高频数据的研究已经成为实业界和学术界的热点问题和难点问题。本文在借助ARFIMA模型的基础上,对连续的期指指数(IF8888)波动率进行预测实证研究。在如今的经济领域中,时间序列的自相关函数缓慢衰减,而常用的模型AR 模型、MA模型及ARMA 模型,通常表现为短记忆性,属于线性平稳模型,难以刻画日益复杂的金融市场。因此如何表现金融资产的长记忆性成为当前学术界关注的焦点。
自从 Granger 和 Joyeux(1980)将长记忆性的概念引入经济学中,长记忆性的研究得到了飞速的发展。在当前的学术文献中,时间序列长记忆性的存在性得到了比较严谨的验证(Geweke & Porter-Hudak,1984; SDerek Bond,2007;陈璞和郑术专,2006;雷鸣,2007)。而在对时间序列长记性的模型研究上,学术界还未达成统一意见。目前存在接受度较高的模型有FDG模型(Granger,1980)、ARFIMA模型(Hosking,1981)、不对称长记忆随机波动模型(A-LMSV)(Ruiz & Veiga,2007)和ARFIMA-FIGARCH 模型(Sang Hoon Kanga,Seong-Min Yoonb,2007)。其中ARFIMA模型不仅能刻画时间序列的长记忆性和短记忆性,而且在高频数据中拟合效果较好。
高频数据由于其交易间隔不等、交易价格不连续以及呈现日内“U”型模式等特点,导致对高频数据的研究变得较为困难。Andersen和Bollerslev(1998)提出了一种基于高频数据全新的非参数波动率度量方法——已实现波动率(Realized Volatility,RV),它的成功推出极大地推动了金融高频数据波动率的研究进展。Koop, Jungbacker 和 Hol(2005)构建了拓展形式的SV模型(SV-RV模型)和ARFIMA模型(ARFIMA-RV 模型),并进行实证检验分析发现已实现波动率的引入可以极大提高传统波动率模型的预测能力。准确度量高频数据的波动率是为了预测,本文以中国连续的期货指数高频数据为样本,基于已实现波动率,建立ARFIMA模型对高频数据波动率进行预测分析。
2 模型介绍
2.1 高频已实现波动率模型
Anderson 和 Bollerslev(1998)首次提出已实现波动率(Realized Volatility,RV),是通过加总某一频率下的日内分时数据的收益平方来得到真实波动率的一个非参数估计,在日内频率选取适当的情形下,“已实现”波动率是真实波动率的无偏、 有效且一致的估计量, 它没有经典算法所带来的时间滞后。
2.2 ARFIMA模型
如果收益率时间序列具有长期记忆性, 则意味着收益是可预测的,长记忆性的存在使得资本市场的行为变得非常复杂, Granger & Joyeus(1980), Hosking等(1981) 分别将分数差分噪声(FI)和ARMA模型相结合提出了ARFIMA模型来描述长记忆过程。
研究发现,对数据进行整数阶差分往往会造成过度差分,将会滤掉序列在低频处的成分,使模型的精度降低, 为解决这一问题, Granger和 Hosking推导出了可以描述序列长记忆性特征的分数阶差分方程ARFIMA。
3 实证分析
3.1 数据选取
本文选取连续的期货指数IF8888在2011年1月4日至2016年8年26日之间的每隔5分钟交易数据的收盘价为样本,排除节假日等一些因素等的影响,共1375天的数据,平均每天54条。选取5分钟交易数据主要是因为吴有英等(2010)提出沪深300最优时间間隔为5分钟,能有效降低市场微观摩擦引起的价格上下跳跃,降低RV的估计偏差。
3.2 已实现波动率统计特征
通过计算样本已实现波动率和日内收益率的均值、方差、偏度、峰度、以及JB统计量,可以发现已实现波动率是非正态,具有严重的偏斜和尖峰厚尾现象,按每日收盘价计算的绝对收益率呈现均值回归和聚集效应,即收益率在0附近波动,并且一个大的价格波动率后面紧跟着一个大的价格波动,一个小的价格波动率后面紧跟着一个小的价格波动,这也说明了股指期货的收益率变化具有明显的非线性特征。
3.3 长记忆性检验
从图一中可以看出,股指期货高频数据存在明显的日内效应,即日内呈现周期性波动,这与我国股指期货市场非连续交易、询报价等市场微观结构因素有关。从图二可以发现已实现波动率存在长记忆性,在滞后80期后自相关函数才衰减为0。
3.4 ARFIMA计量模型
3.4.1 计算d值
因为已实现波动率取对数值后更接近于正态分布,所以看作是可观测变量,有显著的长期记忆性,用ARFIMA模型来刻画。模型如下:
利用Matlab软件,通过R/S分析法可以求出已实现波动率的Hurst指数, 然后通过d=H-0.5的关系式求出分数差分系数d,表1为计算结果。
从上表中可以计算出d值为0.03056,大于0,小于0.5,表明该5分钟级别的已实现波动率呈现为长记忆性特点。
3.4.2 去除长记忆性——分数差分推导及其运用
对于原始序列{Xt} ,可用下列公式表示对其进行d阶差分 ,其中 L为滞后算子 。差分后的序列记为{Wt}。为了方便计算,不失一般性 ,设 X0=0
本文对对数已实现波动率进行分数差分,除去长记忆性,得到短记忆的时间序列:
从表三中可以看出去除长记忆性的时间序列仍然存在尖峰后尾右偏现象,并且Jarque-Bera统计量在1%的置信水平下显著,拒绝原假设,认为样本不存在概率服从正态分布。
3.4.3 确定滞后阶数
对于时间间隔为 5分钟的对数 “已实现” 波动率序列,建立 AR(1),AR(2),AR(3), MA(1), MA(2),MA(3), ARMA(1,1), ARMA(1,2),ARMA(2,2) 等模型, 删除参数不显著的模型, 再选择AIC值和SBC值最小者为最优模型。实证研究表明对于分数阶差分后的对数 “已实现”波动率序列最合适的预测模型是ARMA(1,1)。通过参数估计,最终得到最优的ARFIMA(1,0.0356, 1)模型为:
3.4.4 模型预测
利用ARFIMA(1,0.0356, 1)模型对2016 年8 月15日到8 月26日的已实现波动率进行验证。其中最高误差在9.45%,其平均误差为7.20%,预测结果误差在可接受的范围内,对股指期货投资者有一定的借鉴作用。
4 结束语
本文以连续的股指期货高频数据为样本,在采用5分钟最优的时间间隔降低高频数据的跳跃性,基于已实现波动率,验证了股指期货价格波动呈现长记忆性,因此针对已实现波动率建立ARFIMA模型,得到最优模型ARFIMA(1,0.0356, 1),并利用该模型对已实现波动率进行预测,最高误差在9.45%,其平均误差为7.20%。
参考文献:
[1]陈璞,郑术专.长记忆时间序列的检验方法及对上证指数长记忆性的实证分析[J].科技应用,2006.
[2]雷鸣,缪柏其.存款序列的长记忆实证研究[J].数理统计与管理. 2007(Vol.26.No.4).
作者简介:
杨若一(1984- ),男,汉族,河北馆陶,主任,学士,四川天麓量化技术与创业研究中心,量化投资与量化交易;
胡冰霜(1958- ),女,汉族,山东聊城,教授,博士,四川大学社会学与心理学系,人工智能与量化投资。