论文部分内容阅读
数据预测指的是根据现有数据的基础估计和推算未来数据的过程。随着互联网技术以及数据库技术的迅速发展,人类进入大数据时代。近几年移动互联网和社交网络的蓬勃发展更是推动了这种趋势的发展。我们身边充斥着各种各样的数据:医疗数据、电子购物数据、金融数据等。如何准确的对未来的数据或者数据发展趋势进行预测具有积极意义。传统的数据预测方法有:基于统计模型的预测、基于分类数据树形的预测、基于时间序列分析的预测、以及基于神经网络等智能模型的预测方法。
现有的预测方法中,时间序列预测和回归预测模型是最常用的基于统计的预测模型,但是由于复杂系统所表现出的复杂性,这就使得利用传统的预测方法解决复杂系统预测问题,尤其是遇到内部结构不清晰的系统时用传统预测方法进行建模将会变得很困难。神经网络是计算机对人脑神经元处理信息过程的简化、模拟和抽象得到的一种计算模型。神经网络具有很强的非线性建模能力,能够自适应的从数据中学习隐藏在数据背后的规律。它已经被许多专家学者应用在数据预测领域并且取得了不错的成果,神经网络模型被证明在对大型复杂非线性系统进行建模的时候结果要优于传统的基于统计分析的模型。但是目前基于神经网络的预测模型存在以下的问题:(1)神经网络模型是一种黑箱子模型,虽然能对结果进行准确的预测,但是它无法将得出的结果以一种人类容易理解的方式解释和表达出来。然而实际预测中如果我们能直观的将神经网络模型预测得到的知识显式的表示出来,那么我们将会对所预测的系统有更深入的理解。(2)神经网络中最流行的误差反传学习算法(BackPropagationAlgorithm,BP)以及其他基于BP的改进学习算法大都是基于梯度下降的,因此容易陷入局部最优点并且收敛速度较慢。
为了解决上面的问题,本文在对神经网络模型和模糊系统这两种不同的智能模型进行分析研究的基础上,提出利用模糊神经网络模型来进行数据预测,从而克服神经网络黑盒子模型的缺点。本文提出一种基于模糊C聚类和ANFIS(AdaptiveNeuralFuzzyInferenceSystem)混合学习算法的通用预测框架。很好的解决了模糊神经网络建模中的结构辨识和参数辨识问题。同时我们对传统模糊C聚类进行了改进,提出了改进的基于密度加权的模糊C聚类(ImprovedDensityWeightedFuzzyCMeans,IDWFCM),提高了传统模糊C聚类的鲁棒性和收敛速度。仿真结果表明,IDWFCM算法聚类效果不容易受到噪声数据的影响,并且收敛速度比传统FCM提高了60%,聚类准确率也从88.4%提高到94.2%。最后我们利用IDWFCM实例化了我们提出预测框架,并且对气象因子中的平均气温这个实际问题做了预测,实验结果表明我们预测框架的预测精度比BP神经网络提高10%左右,比传统的ANFIS模型提高15%左右。