论文部分内容阅读
如今,数据采集和存储技术的发展使得许多数据库的数据量极其庞大,要从中分析有价值的信息、知识变得越来越困难,而这种分析需求却与同俱增。数据挖掘就是在海量数据中发现那些隐藏的、人们感兴趣的具有特定规律的信息,是一种发现知识、提取有用信息的过程,这些信息可以用来预测和决策。股票市场作为经济的“晴雨表”在我国经济中起着非常重要的作用,有效的股票预测在金融投资领域占有重要地位。但是股市受政策、经济、以及投资者心理等诸多复杂因素的影响,是一个非常复杂的系统,具有典型的复杂不确定性特点,要对它建立模型非常困难;同时股票交易数据规模越来越大,有关股票价格规律性的信息常常蕴涵在这些海量的数据中。而迅速发展起来的新的数据处理技术——数据挖掘技术提供了一种从这些海量数据中获得隐含的、有价值的信息的重要手段,因此利用该技术对股票信息进行分析和预测有着非常重大的理论意义和实际意义。本文主要探讨利用数据挖掘中的决策树技术对股票交易数据进行分析、挖掘的方法,生成一套关于股票价格走势的分类规则,投资者可以根据这一规则去分析和预测股票价格走势,减小投资风险。主要工作包括:首先针对股票交易数据特点提出了相应的数据挖掘模型;然后对数据进行预处理、构造分析指标作为测试属性;再利用决策树分类ID3算法并适当调整后对数据样本集进行测试分析,生成决策树,形成分类规则,并对其结果进行了检验。通过对股票实际交易数据的运行结果表明:在股票交易数据挖掘模型中使用决策树分类算法对股票进行分析预测是可行的,有效的;最后根据上述挖掘模型和分类规则开发了一套实际的股票分析预测系统,可以对股票交易数据做实时分析预测,为投资者决策提供支持,在采用数据挖掘技术对具有复杂不确定性特点的海量股票信息进行分析和预测上做了一次有意义的尝试。