论文部分内容阅读
预测股票价格是一个高度复杂和非常困难的工作,太多因素比如政治事件,经济数据,交易者期望以及其他环境因素会影响股票价格。另外,股票价格时间序列通常是充满噪声的,动态非线性和高度复杂非参数化的。加噪特性体现在完备信息的不可获得性方面,即金融市场过去的行为并不能完全获取未来和过去价格的所有信息。大多数研究聚焦于股票价格的精确预测,然而不同投资者倾向不同的交易策略,基于实际值与预测值之间的误差最小化的预测模型未必适合他们。而准确预测股价运动方向对于有效市场交易策略非常重要,随着人工智能(Artificial intelligence,AI)在信息处理应用方面的快速发展,AI被应用于商业、工程、管理、科学、军事、金融等不同领域,机器学习被广泛的应用在金融时间序列的预测中。机器学习技术能够模仿波动的股票市场,在股票趋势性预测中可以比传统方法产生更好的预测结果。对金融时间序列预测的机器学习算法有支持向量机(Support Vector Machine,SVM)、朴素贝叶斯分类器(Naive Bayes Classifier,NBC)、人工神经网络(Artificial Neutral Network,ANN)、决策树(Decision Tree)、随机森林(Random Forest,RF)等等。本文基于股票价格时间序列,着眼于股价运动方向的预测,对应用最广泛的模型BP神经网络和随机森林在预测股价方向方面进行研究,并针对这两种算法存在的问题分别作了改进。本文研究内容如下:在预测算法中,BP神经网络模型由于具有优异的容错能力,有力的自我学习能力,非线性匹配能力而成为应用最广泛的模型,然而,BP算法是基于梯度下降方法,特别依赖初始权重的选择,收敛较慢,并且易于陷入局部最小点。这就使得初始权重和阈值尤为重要,本文提出一种自适应变异粒子群算法(APSO),寻找出最优的BP神经网络初始权重和阈值去代替随机值,与BP神经网络结合形成一种新的APSO-BP预测模型,该模型预测精度更高,并且不会陷入局部极值,执行效率更高。传统随机森林算法在面对大量特征属性时,无法对其进行有效区分,因为不同特征对模型可能存在相反或者重复效果,无效特征导致预测模型预测时间增加,预测准确率下降。为了解决这个问题,本文提出将二进制离散粒子群算法BPSO与RF算法结合,形成一种新的BPSO-RF预测模型算法。BPSO算法筛选出最优特征组合,最后将最优特征组合的股票数据输入到RF预测模型,得到趋势预测结果。仿真从预测精度和效率两个角度上与传统RF算法进行比较,仿真实验证明了提出的BPSO-RF算法更有效,预测更精确,减少了预测时间。