基于NPP/VIIRS夜间灯光数据的GDP智能预测模型研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:rxw257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
灯光是衡量人类活动程度的一种直接体现,灯光强度也一定程度上体现了人类活动的强度和广度,夜光数据作为灯光的客观体现方式也逐渐引起人们的重视。尤其是近年来数据共享政策的逐渐完善和传感器的快速发展,夜间灯光数据被广泛应用于衡量人类社会经济的活动中,例如对于国内生产总值GDP(Gross Domestic Product)预测模型的构建,可以将长时间序列的夜间灯光数据作为一个独特的变量应用其中。现今传统统计方法难以准确及时的揭示经济参量时空信息且估算GDP精度不足,故如何消除夜光遥感数据中的误差,构建可靠的时间序列夜间灯光数据,是当前研究的重要研究方向之一;此外,基于夜光遥感数据结合机器学习算法构建GDP智能预测模型时,不同的算法具有不同的预测精度和适用条件,如何为GDP智能预测模型选择最佳算法也是亟待解决的问题。本文利用国家极轨卫星携带的可见光和近红外成像辐射计(NPP/VIIRS)获取的夜间灯光影像为数据源,通过对数据产生的误差进行处理分析,得到了可以用来定量分析的长时间序列数据;其次比较不同的机器学习算法模型在预测GDP方面的利弊,并进行对比分析,得出随机森林模型在构建GDP智能模型研究时具有较好的优势,在此基础上采用贝叶斯优化和网格搜索调整超参数优化随机森林模型。本文主要研究内容与相关工作如下:(1)提出一种利用部分月度(除5、6月份)数据合成年度数据的方法。由于夜间灯光数据在时间分辨率上存在不一致性,且年数据缺失严重,导致数据不完整。针对这一问题利用Arc GIS对夜间灯光栅格数据构建循环输出模型,提出一种利用部分月度(除5、6月份)数据合成年度数据的方法。结果表明:该方式校正效果明显,具有良好的科学性和可靠性,并由此得到可供量化分析的2012-2018年NPP/VIIRS长时间序列夜间灯光数据。(2)使用预处理后的数据构建了梯度提升回归树、决策树、弹性网络回归、随机森林和BP神经网络5个预测模型,全面比较5种回归算法基于NPP/VIIRS灯光数据的预测模型,详述了算法公式、损失函数、正则化、调节参数、优缺点。并结合多种辅助数据和各个模型的优点,构建决策树模型,为了量化预测准确性,对所有算法应用5折交叉验证(5F-CV)。对于基于5F-CV的GBDT、DT、Elastic Net、随机森林(RF)和BP神经网络,重测预测得分的拟合优度值分别为0.95、0.94、0.92、0.95、0.89。结果表明随机森林(RF)算法预测精度更好,且本文采用的5种预测算法均具有的不错的重测鲁棒性。(3)提出一种基于袋外数据估计的回归误差,采用改进的网格搜索算法(Grid Search)对随机森林模型进行参数调优。同时也使用贝叶斯优化(Bayesian Optimization)对随机森林(RF)模型进行参数调优。运用嵌套5F-CV,并通过外部5F-CV循环估算模型的泛化能力,内部5F-CV循环用于确定最佳参数(例如,λ、α或C)找出最优参数模型,建立自动预测系统,根据输入的研究区数据,使算法模型自动进行精准预测。结果表明基于贝叶斯优化改进的随机森林算法在预测GDP时最好,预测精度达到97%,具有较高的准确率和鲁棒性。研究结果展示了机器学习算法和夜间光照指数用于在县级尺度上预测GDP表现出显著的能力。
其他文献
医疗记录的电子化是医疗信息化的关键体现,而电子护理文书是电子化医疗记录的关键部分。目前的电子护理文书系统已被广泛应用。不同医院或厂商的电子护理文书系统各有特点,也存在着一些可以优化的地方。优化的电子护理文书系统能使护士更加高效、精确地完成护理文书的书写记录。本文主要综述我国电子护理文书系统的外观、数据处理和人性化关怀的发展现状,同时对该领域的发展作出展望,以期为电子护理文书系统的优化提供帮助。
2014年《行政诉讼法》修订之后,我国正式确立了行政复议机关作共同被告制度,意在改善复议维持率居高不下的现象,督促行政复议机关积极作为。这一具有明确针对性的制度,自确立之初虽取得了一定成效,但因缺乏理论基础和制度保障,实施效果并不理想。不仅造成行政复议机关压力增大、不作为现象增多以及复议公正性受质疑等问题,还出现了违反共同诉讼制度、处分权主义、举证规则以及级别管辖等法律困境。通过分析该项制度引发的
为有效保护浙江长兴尹家边扬子鳄保护区扬子鳄(Alligator sinensis)种群,丰富野放扬子鳄的遗传多样性,利用13个微卫星标记分析了该种群的遗传多样性,比较核心区和野放区种群的遗传多样性差异。结果显示:保护区扬子鳄种群共检测到31个等位基因,其中含2个稀有等位基因。野放区种群的平均有效等位基因数量(1.82)、平均观测杂合度(0.49)、平均期望杂合度(0.43)、平均多态信息含量(0.
身心健康是大学生学习、生活的基础,是步入社会、适应社会的保障;由于疫情的影响,大学生身心健康问题受到新的挑战。文章以多肉组合盆栽、植物播种和植物拼图3种园艺活动为干预手段,通过生理(血压、心率)及心理指标(简明心境状态量表、PAD三维情绪量表)的测量探究其对疫情下大学生身心健康的影响。结果表明:多肉组合盆栽活动能够显著降低大学生的血压,植物播种活动能够显著降低大学生的心率和舒张压,植物拼图活动能够
当前,我国主要的工程项目均集中在水利项目上,政府对水利项目建设的重视程度也在逐步提高,对项目的投入也给予了较大的支持。为进一步提高工程的实施质量,便需加大对工程技术的管理力度。但在具体实施技术管理工作时,也会出现一定的问题,因此应科学地制定策略进行处理,以此来优化施工技术的应用效果。本文重点对水利项目的施工技术管理工作进行探究,旨在为行业相关人员提供参考。
气象灾害是影响民众生活与生产的关键因素,然而气象灾害并非人力可以控制的,其会给民众造成严重的经济损失。为了充分避免此类问题,气象部门需要构建科学的防灾预警体系。以S县为例,通过分析该县气象灾害预警发布现状,探讨了气象灾害预警信息发布存在的具体问题,并提出了一些相应的优化路径,希望能够为相关单位与人员提供参考。
<正>过去40年中国创造了举世瞩目的"经济增长奇迹",最根本的原因是改革开放,最主要的动力之一是民营企业发展壮大。然而,2016年以来,民营企业利润增速持续低于国有企业,民营企业绩效下降。有学者认为其重要原因在于金融资源错配而导致的融资成本分化。我国是否存在金融资源错配?资源错配对异质性企业绩效的影响有无差异?
期刊