时空序列数据分析和建模

来源 :中山大学 | 被引量 : 0次 | 上传用户:shlchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是(TimeSeries)指被观测到的依时间次序排列的数据序列。从经济、金融到工程技术,从天文、地理到气象,从医学到生物,几乎在各个领域中都涉及到时间序列。对时间序列数据进行统计分析及建模,被称为时间序列分析。近几十年来,时间序列分析得到了人们广泛的关注,并且取得了重要的成果。2003年10月8日瑞典皇家科学院宣布,将2003年度诺贝尔经济学奖授予两位著名计量经济学家罗伯特·思格尔(RobertF.Engle)和克莱夫·格兰杰(CliveW.J.Granger),以表彰两位经济学家在各自领域做出的卓越贡献,而这两位经济学家长期从事的工作中就包括时间序列的分析与预测工作。时空序列(Space-TimeSeries)是时间序列在空间上的扩展,指在空间上有相关关系的多个时间序列的集合。地理研究中碰到大量的时空序列数据,如经济统计序列、卫星影像序列、环境监测序列、交通流量序列等。如何有效地分析和建模时空序列数据,构建时空一体化的时空预测模型,对于研究地理时空现象具有十分重要的意义,并已逐渐成为时空数据分析(Space-TimeDataArialysis)的重要领域之一。目前,有关时空序列分析和预测方面的研究成果较少。近年来,随着神经网络、支持向量回归等智能计算方法的发展为时空序列建模(Space-TimeSeriesModelling)提供了新的手段,面对日益庞大的海量时空数据,迫切需要探索新的时空数据分析工具才能发现其中的地理知识,掌握其变化规律。本文借鉴神经网络、支持向量回归等智能计算方法应用于时间序列分析和空间数据分析中的思想,从寻找易用的、准确的、可靠的、实用性强的时空序列建模方法的角度出发,在对时空白相关移动平均(STARMA)模型进行了深入系统研究的基础上,构建了几种新的时空序列模型,并通过这些模型在实例中的表现,对它们的性能进行了全面的分析和评估。本文主要包括以下几个方面的内容: (1)对时空序列数据的性质进行了深入分析和讨论。时空序列数据(Space-TimeSeries)与一般的时间序列数据(TimeSeries)和空间数据(SpatialData)相比,具有海量(Massive)、动态(Dynamic)、高维(Multi-Dimension)、多尺度(Multi-Scale)、时空相关(Space-TimeAutocorrelation)和异构性(Variability)、时空异质性(Space-TimeHeterogeneity)(或非平稳)、非线性(Non-linear)等特征,并着重讨论了时空白相关和时空平稳性质。研究时空数据的性质对于时空序列分析和建模非常重要。 (2)对时空自相关移动平均模型进行了系统的分析和研究。首先讨论了自回归模型,包括时间自回归模型(AR)、空间自回归模型(SAR),时空自回归模型(STAR),然后分析了移动平均模型,包括时间移动平均模型(MA),空间移动平均模型(SMA),时空移动平均模型(STMA),最后研究了时空自回归移动平均模型(STARMA)建模过程。以东莞市32个镇1994-2002年国民生产总值(GDP)为例,验证了模型预测空间面状(或离散分布)数据的有效性。 (3)对时空异质性(Space-TimeHeterogentity)(或非平稳性)进行了研究,提出了时空序列混合模型(HybridModel)以及时空数据分析四阶段过程。Hybrid模型基本思想是运用神经网络模型多层感知器(MLP)算法提取非平稳时空序列中的大尺度(Large-Scale)或全局的时空非线性趋势(DeterministicNonlinearSpace-TimeTrends),然后用STARMA建模小尺度(Small-Scale)或局部的随机时空变异(StochasticSpace-TimeVariation)。其中,高斯半变异函数(Gaussiansemi-varigramfunction)被用于测度STARMA模型的空间权重。时空数据分析四阶段过程分别是时空数据准备(Space-TimeDataPreparation),探索性时空数据分析(ExploreSpace-TimeDataAnalysis),时空数据训练(Space-TimeDataTraining)和时空数据验证(Space-TimeDataValidating)。运用提出的混合模型(HybridModel)和四阶段过程以我国137个气象站点1951-2002年年平均气温的时空预测为例对提出的模型进行了验证,表明模型预测空间点(或连续分布)数据的有效性。进一步对模型的残差分析结果表明提出来的模型在解释时空变异方面优于传统的STARMA模型。 (4)深入研究了时空自回归移动平均模型(STARMA)模型中的时空延迟算子(Space-TimeLagOperator),结合静态和动态神经元原理,提出了“时空”神经元(Space-TimeNeurons)模型,用“时空”神经元构造了一种新的动态神经网络模型-时空序列神经网络(STANN)模型,并将空间邻接性或距离(SpatialAdjacenty/Distance)等先验知识(PriorKnowledge)嵌入到了STANN模型设计当中,提高了模型收敛速度。另外,通过在STANN模型中通过引入折扣最小二乘(DiscountingLeastSquare,DLS)误差评估准则,使STANN具有了非平稳时空序列建模的能力。并以东莞市32个镇1994-2002年的GDP产值和我国137个气象站点1951-2002年年平均气温的为例对提出的模型进行了验证,表明STANN模型拟合与泛化性能优于STARMA模型,配对t检验结果显示STANN模型预测性能显著地好于STARMA模型。 (5)提出了“时空”核函数(Space-TimeKernelFunction),探讨了“时空”核参数选取的方法。并利用“时空”核函数设计了“时空”支持向量回归模型-STSVR模型。并以东莞市32个镇1994-2002年的GDP产值和我国137个气象站点1951-2002年年平均气温的时空预测为例对提出的模型进行了验证,表明STSVR模型在高维和小样本情况下泛化性能均优于STANN和STARMA模型。 (6)全面比较了各模型的优缺点及它们适用的时空序列数据类型。STARMA是基于模型驱动的线性时空序列模型,可建模平稳时空序列数据;Hybrid是基于数据和模型混合驱动的时空序列模型,可建模非平稳序列数据;STANN与STSVR都是基于数据驱动的时空序列模型,可建模非线性和非平稳序列数据。STARMA、Hybrid、STANN和STSVR四个模型都能在时间域和空间域上较好地拟合和预测时空过程的趋势,其中,STANN和STSVR模型的拟合与泛化性显著的优于Hybrid和STARMA模型;而Hybrid模型在建模非平稳时空序列方面要好于经过差分方法进行平稳转换的STARMA模型;另外,残差分析显示STANN模型在解释时空变异特别是空间变异上明显好于Hybrid和STARMA模型。这说明本文提出的新模型(STANN和STSVR)是建模时空序列的有效工具。
其他文献
居住是人类生存和发展的最重要条件之一,居住问题是人们最关注的问题之一。对流动人口来说,他们在城镇内的居住问题更为重要,因为他们远离家乡,更容易缺乏稳定、适宜的居住条件。
随着新型城镇化进程的推进,人口集聚效应逐渐凸显,经济实力日益增强,城乡用地规模不断扩大。在城乡用地规模不断扩张的过程中,如何按照土地利用总体规划方案保障城乡经济发展
城市化加速推进是当代世界经济发展的特征,良好的生态环境是城市化持续发展的保障。改革开放以来,城镇化成为我国实现现代化的重要发展战略,借助国家城镇化发展战略、西部大开发
学位
为揭示洞穴滴水地球化学变化特征及对外界气候变化的指示意义,本文选取了金华北山的双龙洞和二仙洞为研究对象,从2014年5月到2015年5月对金华北山双龙洞和二仙洞洞穴的水温、
县域功能区划分是指依据县域单元的资源环境承载能力、现有开发密度和发展潜力,统筹考虑生态环境功能和经济社会发展方向,将县域空间划分为不同的具有特定功能类型的空间单元的