论文部分内容阅读
由于我国太阳辐射观测站稀少,很难靠辐射站点的内插或者外推获得较高精度的太阳辐射数据。黄土高原地区太阳辐射观测站很少,符合本文研究的仅有14个站点,而黄土高原地区的气候、水文、生态等研究需要较高精度的太阳辐射数据,因此黄土高原地区的太阳辐射模拟研究就显得尤为重要。现有研究表明机器学习法可以很好地模拟太阳辐射,但不同的机器学习法在不同区域模拟精度不同,为了获得黄土高原地区的精度较高的太阳辐射数据,本文首先分析了各站点气象因素与太阳辐射实测值的相关性,选择了与太阳辐射相关程度较高的平均气压、平均气温、平均水汽压、日照时数、云量、云光学厚度、臭氧、可降水水汽以、DEM、坡度、坡向共11个变量作为模型的输入参数,然后对随机森林(RF)、BP神经网络和支持向量机(SVM)这三种不同机器学习法在黄土高原区的模拟结果及模拟误差进行比较研究,由于黄土高原区太阳辐射站点稀少,为了使模型的训练样本多一些,本文选取了2003~2009年黄土高原地区14个辐射站点的实测数据和2010~2016年10个辐射站点的实测数据作为模型的训练数据,其中留出了2010~2016年4个辐射站点的太阳辐射实测数据作为模型的验证数据,验证结果表明RF模型在黄土高原及周边地区的模拟精度较高。本文又选择了现有的时间连续性较好的三种辐射产品ERA5再分析资料、NOAA_AVHRR卫星产品和CERES辐射产品,和RF模型模拟得到的太阳辐射结果进一步做了比较分析。最后利用误差较小的RF模型模拟得到了黄土高原地区97个气象站点的太阳辐射数据,通过克里金法插值得到了黄土高原地区精度较高的太阳辐射数据,且在年、月和季节尺度上分析了黄土高原地区的太阳辐射时空变化特征。本文的主要研究结论如下:(1)本文通过比较随机森林(RF)、BP神经网络、支持向量机(SVM)三种模型的训练和验证时的误差指标,发现模型训练时,RF模型的均方根误差是三种模型中最小的,模型验证时,RF模型的平均偏差和均方根误差都是三种模型误差中最小的,相关系数最大。(2)本文利用太阳辐射实测数据对随机森林(RF)、BP神经网络、支持向量机(SVM)三种模型的模拟结果进行验证,验证结果表明RF模型的模拟结果与实测数据更接近,各个误差指标均较小,RF模型拟合程度明显优于BP神经网络和SVM两个模型。总体上,RF模型模拟黄土高原地区的太阳辐射效果最优,SVM次之,BP神经网络模拟精度最低。(3)本文通过比较2003~2016年的ERA5再分析资料、NOAA_AVHRR卫星产品和CERES-BSAF再分析资料这三种辐射产品和RF模型模拟结果和误差指标发现,RF模拟得到的太阳辐射精度更高,ERA5再分析资料次之,NOAA_AVHRR卫星产品和CERES-BSAF再分析资料偏差较大。由此可知,RF模型与气象数据及遥感数据结合模拟太阳辐射月均值是一种精度较高且可靠的模拟方法,可以有效解决黄土高原区辐射站点稀少造成的太阳辐射数据缺少的问题。(4)2003~2016年黄土高原地区的太阳辐射在空间上呈现西北多东南少的分布特征,这14年的变化趋势表现为平均缓慢上升,其中在黄土高原的东部地区太阳辐射上升趋势较明显。2003~2016年黄土高原区的1~12月的变化趋势表现为先上升后下降的趋势。2003~2016年黄土高原区的季节变化趋势表现为小幅上升趋势,其中,冬季太阳辐射趋势较明显,春夏季次之,秋季上升趋势不显著。