论文部分内容阅读
摘 要:准确地预测船舶能耗对实现航速优化、纵倾优化等具有重要作用。然而船舶油耗受到多种因素的影响,如航行速度、吃水、风速、浪高等,给船舶油耗预测带来众多困难与挑战。本文收集了在航船舶传感器数据,通过对数据进行预处理,提取了与油耗影响有关的特征数据信息。使用人工神经网络(Artificial Neural Network,ANN)、支持向量机回归(Support Vector Regression,SVR)、岭回归(Ridge)等共7种机器学习方法进行船舶油耗预测。实验结果表明,ANN的R2值大于0.9,预测精度最高,Lasso与Ridge的预测精度最低,R2值皆小于0.5。本文提出的模型可为在航船舶实时油耗预测提供重要参考。
关键词:船舶油耗预测;人工神经网络;支持向量机
中图分类号:U676.3 文献标识码:A 文章编号:1006—7973(2021)05-0138-03
随着世界人口、贸易不断增加,人们对货物的需求不断增加,世界上约80%的货物运输是通过船舶运输完成。根据国际海事组织(International Maritime Organization,IMO)第4次发布的研究报告,2012~2018年,航运业排放的温室气体从9.77亿吨增加到10.76亿吨,增长10.1%,航运业排放比例从原先2.76%上升至2.89%,据IMO估计,按照现有的趋势发展,到2050年,CO2的排放量将比2018年提高50%。
Leifson等考虑风浪、污底附着物对船舶航行的影响,并结合主机与螺旋桨的工况,建立了油耗预测白箱模型,并使用人工神经网络对模型的各个参数进行了求取。Yang等考虑到船舶实际航行中,由于风、浪等航行环境的影响,会造成失速现象,为此采用了Kwon的方法进行了航速估算,建立了远洋船舶的油耗预测模型。Yan等基于在航船舶营运数据,建立了一种BPNN的船舶能耗预测模型,并对通航环境因素与能耗的影响进行了敏感性分析,预测获得的油耗值其精度要高于采用理论公式。Sun等为了加快ANN的预测收敛速度,利用遗传算法对初始连接权值进行了优化,有效提高了模型的训练收敛速度。Wang等在进行航速优化时,使用小波神经网络对航速、水深、风速进行了实时预测,并使用经验公式获得了阻力与航速的关系,在此基础上确定了主机转速与单位海里燃油消耗的函数关系。叶睿与殷振宇等基于一艘丹麦籍客滚轮的运营数据,经过数据清洗,提取了油耗相关的特征数据信息,并使用人工神经网络进行油耗预测。Yan等認为不同通航环境的船舶油耗存在一定的差异,为此采用k-mean方法对航行环境数据进行聚类,并根据聚类结果,分析了长江内河不同位置的环境因素对油耗的影响。高梓博等提出了一种高斯混合模型的聚类方法,并结合最大似然算法,对主机工况、航速等特征进行聚类,聚类结果表明油耗量与主机转速关系并不是一一对应,受到海况的影响较大。
综上所述,目前主要采用单一的方法进行船舶能耗预测研究,缺乏分析、比较各个方法在能耗预测的优劣势。为此,本文结合机器学习常用的回归方法,提出了人工神经网络(Artificial Neural Network,ANN)、支持向量机回归(Support Vector Regression,SVR)、岭回归(Ridge)、Lasso回归、梯度提升决策树回归(GBR)、K最近回归(KNN)及随机森林(RF),共7种回归方法进行船舶能耗预测,分析了各个方法在油耗预测的精度,以及气象环境因素对油耗预测的影响。
1油耗数据采集及预处理
1.1 船舶油耗数据采集
本文数据来源为某油轮的在航船舶实时采集数据。通过对在航船舶安装传感器,如GPS、计程仪、风速风向仪、轴功率仪、油耗仪等。这些传感器会实时采集船舶姿态信息、主机性能状态信息等,如经纬度、航速、航向、吃水、主机转速、功率等数据,这些数据通过网络传输至船端或岸端,并将其储存在数据库中。数据的采集过程如图1所示。
1.2 油耗数据预处理
数据在采集的过程中,由于人为因素、设备仪器、网络信号等原因,致使采集的数据包含很多错误数据与噪声数据。若将这些数据直接用于后续的模型进行训练学习,其能耗的预测值与实际值相差较大,很难反映众多影响因素下油耗实际分布情况,因此需要对采集的能效数据进行数据预处理。本文根据以下原理对采集的数据进行预处理。
(1)根据领域知识,对于风向、流向、船艏向、航向不在[0°,360°]范围内的数据进行删除。
(2)由于该船舶是远洋航行,其大部分是处于满载和压载航行,因此其吃水处于一定的吃水范围内,根据吃水范围,将不在区间范围内的吃水数据删除。
(3)根据转速、航速的分布范围,将航速不在[4,16]kn范围内的数据删除。为保证主机的工作性能,船舶在航行一段时间后,会进行冲车,由于冲车阶段的各个特征数据发生急剧变化,对于冲车阶段的数据需进行删除。
经过以上步骤,数据最开始由12951行删除至11271行。对于前后气象数据相差较大的数据先进行异常识别,对识别后的数据进行线性插值。
2船舶油耗预测模型构建
船舶能耗预测模型如图2所示,主要包括数据预处理、数据集的划分、模型性能评价。在获得干净数据后,通过相关性分析及结合相关领域知识,综合考虑到船舶航行姿态,装载情况、航行气象环境等对油耗的影响,确定了航速、平吃水、纵倾、风速、风向、流速、流向作为模型的输入,每天的燃油消耗量作为模型的输出。
在获得油耗及其相关影响特征数据集后,将数据集按照0.8:0.2的比例划分训练集与测试集。在训练集学习过程中,根据各个特征数据分布情况,通过对训练集进行训练学习,以此确定模型的参数。然而有些模型在训练集的学习效果好,但并不代表模型在测试集的预测效果也好,有可能出现过拟合与欠拟合现象,因此需要综合衡量模型在训练集与测试集性能效果。常见的模型评价指标为均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2),各个指标的计算值可通过式(1)—(4)获得。
关键词:船舶油耗预测;人工神经网络;支持向量机
中图分类号:U676.3 文献标识码:A 文章编号:1006—7973(2021)05-0138-03
随着世界人口、贸易不断增加,人们对货物的需求不断增加,世界上约80%的货物运输是通过船舶运输完成。根据国际海事组织(International Maritime Organization,IMO)第4次发布的研究报告,2012~2018年,航运业排放的温室气体从9.77亿吨增加到10.76亿吨,增长10.1%,航运业排放比例从原先2.76%上升至2.89%,据IMO估计,按照现有的趋势发展,到2050年,CO2的排放量将比2018年提高50%。
Leifson等考虑风浪、污底附着物对船舶航行的影响,并结合主机与螺旋桨的工况,建立了油耗预测白箱模型,并使用人工神经网络对模型的各个参数进行了求取。Yang等考虑到船舶实际航行中,由于风、浪等航行环境的影响,会造成失速现象,为此采用了Kwon的方法进行了航速估算,建立了远洋船舶的油耗预测模型。Yan等基于在航船舶营运数据,建立了一种BPNN的船舶能耗预测模型,并对通航环境因素与能耗的影响进行了敏感性分析,预测获得的油耗值其精度要高于采用理论公式。Sun等为了加快ANN的预测收敛速度,利用遗传算法对初始连接权值进行了优化,有效提高了模型的训练收敛速度。Wang等在进行航速优化时,使用小波神经网络对航速、水深、风速进行了实时预测,并使用经验公式获得了阻力与航速的关系,在此基础上确定了主机转速与单位海里燃油消耗的函数关系。叶睿与殷振宇等基于一艘丹麦籍客滚轮的运营数据,经过数据清洗,提取了油耗相关的特征数据信息,并使用人工神经网络进行油耗预测。Yan等認为不同通航环境的船舶油耗存在一定的差异,为此采用k-mean方法对航行环境数据进行聚类,并根据聚类结果,分析了长江内河不同位置的环境因素对油耗的影响。高梓博等提出了一种高斯混合模型的聚类方法,并结合最大似然算法,对主机工况、航速等特征进行聚类,聚类结果表明油耗量与主机转速关系并不是一一对应,受到海况的影响较大。
综上所述,目前主要采用单一的方法进行船舶能耗预测研究,缺乏分析、比较各个方法在能耗预测的优劣势。为此,本文结合机器学习常用的回归方法,提出了人工神经网络(Artificial Neural Network,ANN)、支持向量机回归(Support Vector Regression,SVR)、岭回归(Ridge)、Lasso回归、梯度提升决策树回归(GBR)、K最近回归(KNN)及随机森林(RF),共7种回归方法进行船舶能耗预测,分析了各个方法在油耗预测的精度,以及气象环境因素对油耗预测的影响。
1油耗数据采集及预处理
1.1 船舶油耗数据采集
本文数据来源为某油轮的在航船舶实时采集数据。通过对在航船舶安装传感器,如GPS、计程仪、风速风向仪、轴功率仪、油耗仪等。这些传感器会实时采集船舶姿态信息、主机性能状态信息等,如经纬度、航速、航向、吃水、主机转速、功率等数据,这些数据通过网络传输至船端或岸端,并将其储存在数据库中。数据的采集过程如图1所示。
1.2 油耗数据预处理
数据在采集的过程中,由于人为因素、设备仪器、网络信号等原因,致使采集的数据包含很多错误数据与噪声数据。若将这些数据直接用于后续的模型进行训练学习,其能耗的预测值与实际值相差较大,很难反映众多影响因素下油耗实际分布情况,因此需要对采集的能效数据进行数据预处理。本文根据以下原理对采集的数据进行预处理。
(1)根据领域知识,对于风向、流向、船艏向、航向不在[0°,360°]范围内的数据进行删除。
(2)由于该船舶是远洋航行,其大部分是处于满载和压载航行,因此其吃水处于一定的吃水范围内,根据吃水范围,将不在区间范围内的吃水数据删除。
(3)根据转速、航速的分布范围,将航速不在[4,16]kn范围内的数据删除。为保证主机的工作性能,船舶在航行一段时间后,会进行冲车,由于冲车阶段的各个特征数据发生急剧变化,对于冲车阶段的数据需进行删除。
经过以上步骤,数据最开始由12951行删除至11271行。对于前后气象数据相差较大的数据先进行异常识别,对识别后的数据进行线性插值。
2船舶油耗预测模型构建
船舶能耗预测模型如图2所示,主要包括数据预处理、数据集的划分、模型性能评价。在获得干净数据后,通过相关性分析及结合相关领域知识,综合考虑到船舶航行姿态,装载情况、航行气象环境等对油耗的影响,确定了航速、平吃水、纵倾、风速、风向、流速、流向作为模型的输入,每天的燃油消耗量作为模型的输出。
在获得油耗及其相关影响特征数据集后,将数据集按照0.8:0.2的比例划分训练集与测试集。在训练集学习过程中,根据各个特征数据分布情况,通过对训练集进行训练学习,以此确定模型的参数。然而有些模型在训练集的学习效果好,但并不代表模型在测试集的预测效果也好,有可能出现过拟合与欠拟合现象,因此需要综合衡量模型在训练集与测试集性能效果。常见的模型评价指标为均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2),各个指标的计算值可通过式(1)—(4)获得。