论文部分内容阅读
汇率一直是一个国家衡量国内外经济金融波动的关键经济指标,它不仅是国家间经济竞争的指标,也是彼此受竞争货币价值制约的商业关系指标。以往,人民币汇率走势更多的受政策影响,但随着汇率制度的多次改革以及我国扩大对外开放的需求,人民币市场化程度势必加深,政策对汇率的影响力逐渐减弱,因此结合市场因素把握未来汇率走势为制定汇率相关政策和风险行为决策提供帮助变得愈加重要。本文针对人民币日度汇率值和相关经济基本变量,采用若干数据挖掘方法对数据进行综合分析比较,结果表明,经济基本变量对人民币日度汇率值的走势会产生较大的影响。本文具体研究内容如下:第1章是对汇率市场研究背景、研究意义和目的做出详细介绍,了解国内汇率的市场化改革进展,随后是对国内外汇率市场研究现状做梳理总结。第2章主要介绍数据来源、收集的数据异常值处理以及日度汇率值的统计分析。选取从2006年10月9日起至2019年的12月3日止,去除节假日数据,美元兑人民币、英镑兑人民币、欧元兑人民币、人民币兑日元有效交易日的日度数据作为响应变量,每种货币对共有十二个特征变量,并对四类日度汇率值进行统计分析。第3章基于时间序列分析和特征工程对数据做进一步挖掘。时间序列分析表明汇率值是由趋势成分、随机成分、无季节成分构成的时间序列。通过特征相关性分析、聚类分析、散点图矩阵分析对特征间的内在关联进行挖掘和直观的展示。证明特征彼此之间存在相关性,最后利用特征提取中的主成分降维,找到重要特征、减少特征数,消除相关性。第4章基于特征选择得到的特征变量对涨跌数据做分类预测。分类预测包括朴素贝叶斯,随机森林,GBDT,XGBoost模型,总体来看集成学习类型的预测性能最佳,最高AUC得分是0.869。实验结果表明本文所收集的经济基本变量对日度汇率的波动是有影响的,只是这种影响的传递存在10-20个工作日的时间差,侧面证实了经济基本变量预测汇率值的可行性。第5章基于特征提取得到的主成分因子对汇率值做回归预测。设定三种机器学习回归模型(线性回归、自向量回归、门控循环单元神经网络),四类货币对以及五个时间步长参数,分别进行迭代训练和回归预测。结果表明,GRU神经网络模型在美元兑人民币的回归预测中精确度最高,R2为0.9842,RMSE等于0.0285,MAE等于0.0239,MAPE等于0.0035,并且结果显示回归预测步长最好设置在10个交易日内,由此可以看出短期回归预测表现优异。第6章对前文所作分析进行概括性总结,列举主要的研究方法和研究结论,分析不足之处并展望今后的发展方向。