论文部分内容阅读
股票市场是企业融资和股民投资的重要手段,股市预测研究对投资者、企业、政府政策制定都具有重大的理论与现实意义。相较于单日预测,短线趋势的预测尤其是短线趋势拐点的预测无论是对于短线投资者还是中长线投资者都具有很大的操作指导意义。但股市受到实时因素的影响,且这些因素具有不确定性,因而股票趋势数据的分布具有可变性。传统方法是利用大样本数据学习模型,忽略数据分布可变性,难以有效预测股市拐点。有学者提出滑动窗口方法对近期数据进行训练,属于小样本学习问题,容易产生过拟合,导致模型的泛化能力不强。基于此,论文研究工作如下:针对小样本,基于数据分布变化检测和大样本学习获得的知识,提出一种混合加权的支持向量机模型(Mixed Weighted Support Vector Machine,MW-SVM)用于股市拐点预测。新模型在加权支持向量机模型(W-SVM)中引入平衡项以避免过拟合,平衡项是用大样本学习得到模型参数和用当前小样本对学习所得模型参数的均方误差,并利用KL散度度量小样本分布与大样本分布之间的距离。基于新模型,提出一种特征能量融合的拐点预测算法;提取与拐点相关的技术指标,并对技术指标进行量化计算,进而利用马尔可夫毯对量化后的指标进行特征能量融合,最后将能量信息带入到MW-SVM得到基于能量的MW-SVM模型(MW-SVM based on energy,EMW-SVM),对股市拐点进行预测。实验结果表明,EMW-SVM算法具有良好的性能。基于EMW-SVM算法,从沪深300成分股中选择预测结果为低点的股票用于投资组合。股票的最优投资组合策略也是股票实际操作一个难题。当前利用历史数据的组合模型,忽略近期数据分布的变化,导致组合难以有效适应,收益表现不够稳定。提出一种数据分布可变的概率投资组合模型(Probability Portfolio Model,PPM)。首先做空沪深300股指期货以对冲大盘,同时最大化组合跑赢沪深300指数的概率。在收益率数据服从独立同分布的假定下,利用近期数据模拟差额收益△Cr(组合收益减去沪深300指数涨幅)的概率分布,并借鉴在险价值(Value at Risk,VaR)的思想,在给定置信水平α下得到△Cr的最小收益,并最大化该最小收益。在此基础上,引入KL散度检测数据分布变化,当KL散度超过给定阈值后则重新计算模型以使模型适应当前分布。最后通过股市的数值算例表明PPM算法具有良好的性能。