论文部分内容阅读
降水是近地表水循环系统最重要的水分输入,是影响区域水资源状况、大气环流的重要因素,是气候变化关键要素,定量化的降水空间分布数据对于地表水分状况、水循环、气候变化等研究至关重要,对降水的空间分布的准确估算对于区域及流域径流研究尤其重要。近三十年来,对地观测技术的不断发展和应用,大大丰富了全球大尺度降水监测资料获取的途径,但是较低的空间分辨率限制了卫星遥感降水数据在区域研究中的应用。空间尺度转换方法为基于卫星降水数据获取高空间分辨率降水连续分布数据提供了有效的途径。 本研究在传统的卫星降水数据空间降尺度方法的基础上,提出了基于机器学习算法的卫星降水数据空间降尺度方法,以中国区域为例,在定量分析降水与地表相关参数的关系的基础上,重点探讨了降尺度方法对于月尺度和周尺度降水数据降尺度估计的效果,对四种常用机器学习算法在月降水量降尺度估计中的精度进行了定量验证与对比分析,并深入剖析了降尺度结果精度的影响因素。在此基础上,提出了历史降水数据的降尺度重建方法,利用随机森林算法实现对1982-2012年中国区域TRMM年降水量的空间降尺度重建,最后分析了中国区域近三十年来年降水量变化趋势和空间分布特征。得出如下结论: (1)在中国区域内,TRMM降水量与NDVI和地表温度之间显著相关,其相关系数存在时空差异。在月尺度上:降水量与NDVI在全国大部分地区呈现正相关关系,北方大部分区域NDVI最大值滞后于降水周期为0~1个月,长江以南大部分地区滞后周期为2~3个月;白天和夜间地表温度与月降水量也呈现较为显著的正相关关系。在周尺度上:陕西省和山西省大部分地区NDVI与同期降水量相关系数达到最大,华北平原大部分区域NDVI滞后于降水周期为1周,青藏高原和东北大部分区域滞后周期为2~4周,东南大部分地区滞后周期均大于7周;降水与昼夜地表温度在中国北方及青藏高原大部分区域呈现较为显著的正相关关系,白天地表温度在东南地区与降水表现为负相关,但该区域夜间地表温度与降水没无显著关系,昼夜地表温度差在青藏高原南部、华北及东北平原地区,与降水量负相关,在华南和新疆北部地区,与降水量正相关。 (2)在k-NN、CART、SVM和RF四种算法中,RF算法具有最高的训练精度,且训练精度对参数的选择不敏感,具有较好的健壮性,SVM算法的训练精度对参数的设置较为敏感。从空间降尺度结果的精度来看,基于RF和SVM算法的降尺度模型精度较高,但SVM算法对于残差修正的依赖性较强,RF算法在残差修正前后均具有较高的精度,受残差修正过程的影响较小。四种机器学习算法的精度均优于传统多元线性回归算法。降尺度结果在各站点的平均绝对误差自南向北递减、自西向东递增,与平均降水量呈现正相关关系,在低海拔区域随高程升高而降低。平均相对误差自西向东递减,但与纬度及海拔高度之间无明显关系。降尺度结果的误差与TRMM原始数据的误差高度相关,说明如果降尺度算法可以准确模拟降水与相关因子之间的关系,降尺度结果的精度则主要取决于原始卫星降水数据的精度。 (3)在月尺度上,基于机器学习算法的空间降尺度模型具有较好的空间可拓展性,可实现对中国东北地区TRMM数据未覆盖区域的空间降尺度重建,重建结果与站点观测值一致性较高,部分站点R2达到0.9以上,重建结果可以准确反映区域降水量的年内和年际变化特征。 (4)对长江中下游和青藏高原区域TRMM周尺度降水量空间降尺度估计的结果与原始TRMM数据高度吻合,可以准确反映原始TRMM数据的数值变化和空间分布特征,但其定量误差高于月尺度降水量降尺度结果,其中,长江中下游区精度高于青藏高原区。降尺度结果对大部分降水事件估计的命中率较高,可以在时序上提供对“有雨”和“无雨”的有用估计。周尺度降水量降尺度估计结果的绝对误差与站点观测值呈现正相关关系,相对误差的绝对值与观测值负相关,当降水量较小时,降尺度估计值表现为高估,降水量越小,高估越明显。长江中下游区降尺度结果在各站点的误差与站点地理位置和海拔高程之间没有明显关系,对于青藏区,绝对误差由南向北递减且与海拔高程呈现正相关。 (5)对1982-2012年中国区域年降水数据降尺度重建结果可以准确反映中国区域降水量的年际变化规律和极大极小值分布情况。三十年间,中国地区年降水量总体呈现减少趋势,其中,黄土高原地区、长江中下游地区和华南地区年降水量减少趋势较为显著,黄淮海地区及四川盆地区域年降水量以增加为主。