基于随机森林回归的国债期货价格预测

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:tang18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能进入人们的视野,越来越多的投资者将机器学习和证券市场投资结合在一起,以期获得良好的收益。随机森林是机器学习中用于分类和回归的重要工具。本文将5年期国债期货指数(代码TF0000,以下简称TF指数)投资分析转化成一个学习问题,运用2013年9月6日(5年期国债期货上市日)到2015年12月31日的TF指数日收盘价共564个数据对技术指标和宏观经济指标进行筛选,然后再利用筛选后的指标运用随机森林回归模型对2016年1月1日至2017年10月31日的TF指数日收盘价共445个数据进行预测。本文所作的主要工作有:一、通过基于分形理论的Hurst指数对TF指数进行检验,发现TF指数并非有效,因而根据市场有效假说,技术分析和基本面分析在这个市场均有其用武之地。二、选择几种常见的技术指标,用指标筛选集挑选出每种TF指数技术指标在历史上表现较好的参数;同时筛选出与TF指数指标筛选集数据相关性较高的宏观经济指标。三、分别将技术指标和技术与宏观指标结合这两种形式直接作为输入变量,通过随机森林回归对TF指数的收益率进行预测;再通过主成分分析(PCA)压缩输入变量的维数,通过随机森林回归对TF指数的收益率进行预测,这样我们得到了4个模型。四、对上述每个模型,我们分别将GARCH模型计算出来的波动率和通过普通方差计算的历史波动率(波动率都以?表示)乘以常数k得到以k~?作为阈值,一旦预测结果大于阈值k~?,就买入指数,并一直持有头寸,直至预测的结果小于阈值k~?便卖出平仓;一旦预测结果小于阈值-k?,就卖空指数,并一直持有头寸,直至预测的结果大于阈值-k~?便买入平仓。模型的结果显示,从预测值相对与真实值的误差(RMSE和MAE)来看,技术指标结合宏观经济指标作为随机森林回归输入变量总要优于仅仅使用技术指标,这也许可以归功于模型输入变量所包含的信息相对更多,同时也说明了基本面分析对于债券分析的重要性;再者,输入变量经过PCA的处理并不一能减少预测误差,这也印证了文献综述中提到的随机森林不用考虑多元回归中所涉及到的多重共线性问题,在随机森林模型中我们甚至可以加入几千个自变量。模型的结果也显示,从利用相关交易信号进行实际投资的效果(以年化夏普比率为衡量标准)来看,技术指标结合宏观经济指标作为随机森林回归输入变量的实际投资效果总要优于仅仅使用技术指标。这与从预测值相对与真实值的误差(RMSE和MAE)分析的结果类似。但是,与误差分析结果不同,输入变量经过PCA的处理能在一定程度上改善实际投资效果。本文的创新之处是:在检验TF指数有效性的时候通过滚动窗口验证,增强了检验结果的可靠性;将随机森林回归方法和TF指数预测相结合;把宏观经济指标和技术指标结合起来一起作为随机森林回归输入变量,输出变量不是简单的“涨”“跌”分类,而是具体的收益率;不仅探索模型预测的精确度,而且通过特定的阈值过滤信号来进行投资,回测模型用于真实投资的有效性。
其他文献
对宁波市7-18岁在校青少年进行体质健康状况的测试,并进行统计分析,探寻青少年身体形态和运动素质发展趋势,研究宁波市青少形体发育和运动素质发展的规律和敏感区。为更好地
随着可持续发展战略的提出,绿色施工必然会成为建筑施工的发展方向。与传统的施工技术相比,绿色施工考虑了绿色环保的因素,注重对环境的保护。传统建设项目的多目标管理只考
副校长是校长的助手,在深化课改的过程中,发挥着不可或缺的重要作用。提升副校长的领导力是落实课改的关键。主题培训是提升副校长领导力的主要途径;转变观念、发挥作用是提
综述了纳米氧化锌的研究现状、制备技术、应用性能及研究方向
宁波市教师教育特色数字文献资源库是宁波市数字图书馆建设项目的重要组成部分,对均衡我市基础教育资源、促进教师专业成长有重要作用。文章阐述了该特色资源库建设的背景与