基于时序随机森林的湖泊藻类浓度预测方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:Cary1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水体富营养化与藻类水华是全球性的水环境恶化问题,给自然生态和人类生产生活都带来极大危害。因此,有必要结合水质监测技术建立预警预报体系。藻类水华暴发的前提是藻类种群浓度剧增,所以实现水华预警预报的关键在于预测藻类种群浓度的变化。然而,一直以来,藻类生长及其动态积聚过程的复杂性是藻类浓度预测问题中的研究难点。  本文针对现有预测方法难以同时兼顾藻类本身生长机理和生长环境中不确定性因素的不足,以蓝藻水华频发的太湖梅梁湾作为研究区域,提出了基于时序随机森林的藻类浓度预测方法,实现了对太湖梅梁湾藻类浓度的逐月预测。本文主要研究内容和创新点如下:  (1)基于太湖流域现有的水质监测技术条件,根据由梅梁湾历年观测数据分析所得的藻类生长特性,确定了以叶绿素a(chlorophyll-a,Chla)浓度表征藻类浓度、以可获得的水质参数和部分参数的比值表征环境因素的基本研究方法;对典型生长机理模型进行了验证,表明了机理驱动模型在中长期月度预测方面的局限性,同时考虑到现有水质自动监测技术的可行性,明确了采用数据驱动建模的技术路线。  (2)针对藻类生长机理复杂、受各环境因素协同影响较大、不满足确定性模型假设条件的特点,提出了基于随机森林(Random Forest,RF)的藻类生长关键因素分析方法。首先,利用随机森林中的变量重要性测度方法,从可能影响藻类生长的各环境因素中筛选出了5个关键环境因素,分别是“高锰酸盐指数”、“总氮:总磷”、“总磷”、“溶解氧”和“水温”;其次,对藻类浓度与筛选出的5个关键环境因素,建立了RF回归模型;同时,将基于随机森林的关键环境因素提取方法和定量关系分析方法,与线性分析方法作对比。模型验证结果表明,RF回归模型的预测误差远低于偏最小二乘(Partial Least Squares,PLS)回归模型的预测误差,说明了随机森林方法在相关因素提取方面的优势,验证了RF回归模型对藻类生长与环境因素之间复杂非线性关系的准确解释能力。  (3)针对藻类生长呈现明显年度季节性规律的特点,结合藻类生长与环境因素关系研究的结论,以及时序分析基本理论,提出了基于RF多元非线性时序分析的藻类浓度预测方法;用太湖梅梁湾1999年~2004年的实际观测数据构建了RF多元非线性时序预测模型,对2005年至2006年期间的藻类浓度实现了逐月预测,预测值与实测值的拟合优度R2为0.87;对比经典的差分自回归移动平均(Autoregressive Integrated Moving Average Model,ARIMA)模型的预测效果,预测精度有所提升,但在藻类浓度峰值预测方面表现仍欠佳。  (4)为了进一步提高预测精度,针对藻类生长在呈现年度季节性规律的同时具有随机波动混沌特性的时序特征,基于MA时序分析思想,结合经典ARIMA时序分析和RF多元非线性时序预测方法的优势,提出了基于ARIMA-RF融合时序分析的藻类浓度预测方法;用太湖梅梁湾1999年~2004年的实际观测数据构建了ARIMA-RF融合时序预测模型,对2005年至2006年期间的藻类浓度实现了逐月预测,预测值与实测值的拟合优度R2达0.93,预测精度显著高于传统ARIMA模型和RF多元非线性时序预测模型;该预测结果可以为太湖梅梁湾藻类浓度预警预报提供参考依据,而该方法也为藻类浓度预测方法研究开拓了新思路。
其他文献
视线追踪(Eye-Gaze Tracking),也称为眼动跟踪(Eye Tracking),是综合利用现有各种检测手段获取受试者当前视觉注意方向并记录其变化过程的技术。早期的视线追踪技术主要作为认
遥感图像中的房屋检测是目标检测领域的一个重要分支。其在城市规划、变化检测及GIS信息构建等方面发挥着至关重要的作用,日渐成为学术界和工业界的研究热点之一。然而,遥感图
环境感知是移动机器人具备人工智能的重要且首要条件。场景三维信息获取、目标检测与跟踪等是环境感知的重要组成部分,在军事、安保、助老助残等方面具有广泛的应用前景。本文
微装配系统是微机电系统(MEMS)发展过程中必不可少的关键技术之一,在微小零件的装配、微型光学系统的组装、MEMS传感器的封装等领域发挥着重要作用。但目前微装配技术中还没
学位
语音驱动发音器官运动可视化及差异分析研究是可视语音合成研究和病理语音分析的重要课题之一。人类语音产生与发音器官运动有着紧密联系,然而由于多数发音器官隐藏在口腔内部
城市污水生化处理过程具有显著的非线性特征,并且其连续运行还要面临着各种约束。仿真技术通过建模和试验研究,可为自动控制方案的开发提供一种省时省力、方便快捷的研究方法。
广义系统理论自20世纪70年代提出以来,展现了较强的应用背景,因此对其理论的研究及应用吸引了国内外众多学者的关注,并逐渐发展成为当今最重要的控制理论分支之一。时滞是工程系
非线性科学是研究不同学科中非线性现象共性的一门前沿学科,是在以非线性为特征的各门分支学科基础上发展起来的综合性学科.非线性动力学行为的研究不仅具有重要的理论意义,还
常见的精神疾病,包括注意力缺陷多动障碍,自闭症,双向情感障碍,抑郁症和精神分裂症等,是高度可遗传的多基因疾病。有证据表明这五种疾病既有共同的又有特异性的遗传和神经机制。本
为实现巡航导弹对目标的精确打击,本文围绕空射巡航导弹的飞行控制系统、航迹规划、航迹跟踪、三维导引律和三维视景仿真等内容展开了一系列研究工作。   首先,研究了巡航
学位