论文部分内容阅读
以随着计算机软、硬件的进步,人们利用信息技术产生和搜集数据的能力大幅度提高。数以千万计的数据库被用于商业管理、政府办公、科学研究和工程开发等方面,收集工具的进步使我们拥有了海量的数据。面对这些数据,急需一些新的工具和技术,解决由此带来的“数据丰富,信息贫乏”的问题,数据挖掘技术应用而生。 作为数据挖掘的重要研究课题之一,时间序列的挖掘与预测近几年发展迅速。由于数据描述的特殊性,如何把传统的数据挖掘技术应用于时间序列的挖掘与预测中为国内外学者广泛关注。 本文在综述国内外数据挖掘研究发展概况后,对时间序列的表达、相似性搜索、建模及预测等几个问题进行研究分析,在时间序列的分段线性化表示和相似性度量准则以及时间序列的建模与预测方面取得了一些成果,主要的研究内容和研究成果如下: 1.对时间序列的分段线性化表示进行了研究,采用新的分段线性化表示方法建立了序列相似性度量准则,弥补了以往度量准则对时间轴上伸缩的变化敏感的问题。并对分段线性化表示的挖掘算法进行了探讨。 2.对时间序列的统计学特性进行了研究,针对复杂时间序列中长记忆效应与短范围相依过程并存,导致时序预测建模过程复杂的问题,提出了多层分解,并对分解后的序列根据不同的平滑程度进行不同频率的采样及有针对性建模。使得在减少计算的同时保证预测的精度。 3.对以上方法使用股票数据,进行了验证。 最后,在总结全文的基础上,指出了未来有待深入研究的若干个问题。