论文部分内容阅读
本文针对股市预测分析问题,对基于神经网络股市预测的数据挖掘模型进行了研究,提出在模型设计中,采用属性相关性分析理论对输入指标变量和目标变量作必要的相关性分析,以此优选输入变量组合,从而提高网络的预测性能。并在股票交易的历史数据基础上,进行了实证分析。大致工作流程为:首先利用数据库查询技术,实现多个候选的技术指标变量的计算,然后对概化后的指标数据,采用信息增益度量方式计算出各指标属性与目标变量的相关性大小,筛选出强相关的属性作为网络模型的输入变量,再从中随机选出相互独立的训练集和测试集样本,最后采用MATLAB 软件的神经网络工具建立连续和离散两种径向基函数网络模型,分别对其进行训练和测试,完成相应的股价预测,结果采用输出值和实际值的均方误差来反映预测精度。本文用到的数据概化技术和属性相关性分析技术,同样适用于除神经网络模型外的其他数据挖掘模型中输入变量与输出变量的关系分析,如:决策树算法中的分类问题。