基于PSO-SVM的水工隧洞施工成本预测

来源 :人民黄河 | 被引量 : 0次 | 上传用户:chrisliuyaqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:为了对水工隧洞工程施工成本进行精确预测,从工程、环境、市场以及管理4个方面分析了水工隧洞施工成本影响因素,构建了水工隧洞施工成本影响因素量化方法。采用粒子群算法(PSO)优化支持向量机(SVM)模型中的惩罚因子C和核函数参数g,建立基于PSO-SVM的水工隧洞施工成本预测模型。对比SVM模型的预测结果发现,PSO-SVM模型的平均绝对百分比误差和均方根误差更小,训练速度更快,预测效果更好。
  关键词:成本预测;支持向量机;粒子群算法;水工隧洞
  中图分类号:TV554
  文献标识码:A
  doi:10.3969/j.issn.1000-1379.2021.09.031
  引用格式:刘英杰,聂章琴,王博,等.基于PSO-SVM的水工隧洞施工成本预测[J].人民黄河,2021,43(9):160-164.
  Construction Cost Prediction of Hydraulic Tunnel Based on PSO-SVM
  LIU Yingjie1,2,3, NIE Zhangqin1, WANG Bo1,2,3, XU Yahui1
  (1.School of Water Conservancy, North China University of Water Resources and Electric Power, Zhengzhou 450046, China;
  2.Collaborative Innovation Center of Water Resources Efficient Utilization and Support Engineering, Zhengzhou 450046, China;
  3.Henan Key Laboratory of Water Environment Simulation and Treatment, Zhengzhou 450046, China)
  Abstract: In order to accurately predict the construction cost of hydraulic tunnel engineering, this paper analyzed the influencing factors of hydraulic tunnel construction cost from four aspects of engineering, environment, market and management, and established a quantitative system of influencing factors of hydraulic tunnel construction cost. Particle Swarm Optimization (PSO) was used to optimize the penalty factor C and kernel function parameter G in the support vector machine (SVM) model, and the construction cost prediction model of hydraulic tunnel based on PSO-SVM was established. Compared with the prediction results of SVM model, the average absolute error percentage and root mean square error of PSO-SVM model are lower, the training speed is faster and the prediction effect is better.
  Key words: cost forecast; support vector machine; particle swarm optimization; hydraulic tunnel
  水工隧洞工程具有施工條件复杂、工期长、技术难度高、投资规模大等特点。准确预测水工隧洞成本是实现水工隧洞成本管理的首要任务。成本预测方法包括线性回归法、时间序列法、灰色理论、神经网络、支持向量机(SVM)等。线性回归法认为工程成本是线性变化的,时间序列法是研究历史数据随时间的推移而发生的变化,而水工隧洞成本受施工条件和气象条件等多因素的限制是非线性和不确定的;灰色理论通过分析各影响因素间的关联度来预测成本,适合低维数据;神经网络的优化算法为误差梯度下降法,但容易陷入过拟合、局部最优等问题。SVM算法可以避免过拟合,在样本数据较少的情况下也能进行预测,在成本预测领域被广泛使用,如:秦中伏等[1]将主成分分析法和支持向量机相结合,对住宅工程成本进行了预测;Zhang Y等[2]构建了基于随机森林-支持向量机的工程成本预测模型;李静等[3]通过遗传算法优化支持向量机,完成了对输电塔造价的预测;乔国华等[4]构建了基于遗传算法的最小二乘支持向量机模型,对变电站全寿命周期成本进行了预测;刘飒等[5]构建了基于主成分分析法和支持向量机的企业成本预测模型。SVM的参数选择与模型的训练效果有密切的关系,选择参数的传统方法用时太长,且很难得到全局最优解。粒子群优化(PSO)算法在优化领域中被大量使用,取得了良好的效果,如:黄敏等[6]基于粒子群算法优化支持向量机构建了山区公路隧道成本预测模型;高昆仑等[7]通过粒子群算法优化支持向量机,预测了未来网络安全态势。本文针对SVM选择参数时存在的盲目性问题,提出利用PSO算法优化其模型参数,对水工隧洞施工成本进行预测。   1 水工隧洞工程施工成本影响因素分析
  1.1 影响因素识别
  水工隧洞工程施工成本的影响因素很多,一般而言应考虑工程方面、环境方面、市场方面和管理方面的影响因素[8-15]。工程方面包括压力状态、长度、横断面面积、横断面形状、衬砌类型、掘进方式等;环境方面包括围岩类别、气象条件、场地施工条件、场内外临时交通状况等;市场方面包括人工、材料、机械的价格及其变化趋势;管理方面包括业主管理水平、承包商管理水平、监理管理水平、施工工期等。
  1.2 主要影响因素量化
  水工隧洞工程施工成本的影响因素量化方法见表1。
  2 基于粒子群算法的支持向量机成本预测模型
  2.1 支持向量机回归模型
  SVM基于结构风险最小化,使用核函数将数据映射到高维空间,寻找其最优超平面。
  假设样本数据D={(xi,yi)|i=1,2,…,n}(其中:xi为第i个样本的输入值,yi为输出值),SVM找到一个与y相近的回归函数f(x):
  fx=[w,Φ(x)]+b(1)
  式中:yi∈R;w为权值系数;Ф(x)为映射函数;b为偏置项。
  SVM算法通过求解下述问题确定w和b:
  min12‖w‖2+C∑ni=1(ξi+ξi)
  s.t.yi-[w,Φ(x)]-b≤ε+ξi
  [w,Φ(x)]+b-yi≤ε+ξi
  ξi、ξi≥0(2)
  式中:ξi、ξi*为松弛变量;C为惩罚因子,C>0;ε为容许误差。
  引入拉格朗日乘子可得:
  L=12‖w‖2+C∑ni=1(ξi+ξ*i)+ ∑ni=1λi[yi-wΦ(xi)-b-ε-ξi]+∑ni=1λ*i[wΦ(xi)+b-yi-ε-ξ*i]-∑ni=1(ηiξi+η*iξ*i)(3)
  其中λi、λ*i、ηi、η*i≥0。
  则上述优化问题的对偶形式为
  max[-12∑ni=1∑nj=1(λi-λ*i)(λj-λ*j)K(xi,xj)+
  ∑ni=1(λi-λ*i)yi-∑ni=1(λi-λ*i)ε]s.t.∑ni=1(λi-λ*i)=0
  0≤λi≤C,0≤λ*i≤C(4)
  设由式(4)得到的最优解为α={α1,α2,…,αn}、α*={α1*,α2*,…,αn*},则
  w=∑ni=1(αi-αi)Φ(xi)(5)
  b=1Nnsv{∑0<αi<C[yi-∑(αi-αi)K(xi,xj)-ε]+
  ∑0<αj<C[yi-∑(αj-αj)K(xi,xj)-ε]}(6)
  式中:Nnsv为支持向量个数。
  于是,回归函数为
  fx=wΦ(x)+b=∑ni=1(αi-αi)Φ(xi)Φ(xj)+
  b=∑ni=1(αi-αi)K(xi,xj)+b(7)
  其中K(xi,xj)为核函数,K(xi,xj)=Ф(xi)Ф(xj)。
  径向基函数为
  kRBF(xi,xj)=exp[-g(xi-xj)2]  (g>0)(8)
  式中:g为核函数方差,g=1/(2σ2)(σ为核函数的宽度参数)。
  2.2 粒子群优化算法
  粒子群算法(PSO)通过不断迭代找到最优解。设在一个D维空间中存在n个粒子构成的群体x={x1,x2,…,xn},第i个粒子的位置为xi=(xi1,xi2,…,xiD),速度为vi=(vi1,vi2,…,viD),个体极值为Pi=(Pi1,Pi2,…,PiD),群体极值为Pg=(Pg1,Pg2,…,PgD),在不断迭代过程中,根据式(9)和式(10)更新xi和vi,通过适应度函数F求适应度值并更新个体极值Pbest和群体极值Gbest,达到最大迭代次数或适应度值小于设定值时迭代终止。
  xk+1iD=xkiD+vk+1iD(9)
  vk+1iD=ωvkiD+c1r1(PkiD-xkiD)+c2r2(PkiD-xkiD)(10)
  式中:ω為惯性权重因子;k为当前迭代次数;viD为速度;c1和c2为加速度因子;r1和r2为在[0,1]区间的随机数。
  2.3 基于粒子群算法的支持向量机成本预测流程
  基于PSO-SVM的水工隧洞施工成本预测流程如图1所示。
  步骤1:收集水工隧洞的历史施工成本数据并构成数据集,把数据集分为训练集和测试集。
  步骤2:运用MATLAB软件的mapminmax函数对数据进行归一化处理。
  步骤3:设定粒子群的参数,得到粒子的位置与速度。
  步骤4:根据粒子目前的位置,得到C、g值,利用svmtrain函数创建SVM预测模型,求解粒子适应度值,对比PkbestiD,如果现在的值更接近设定值则替代PkbestiD。
  步骤5:对比每个粒子的适应度值与群粒子的适应度值,如果群粒子的适应度值大于每个粒子的适应度值,则用PkbestiD替代GkbestiD,根据式(9)、式(10)更新粒子的位置与速度。
  步骤6:判断是否达到终止条件,如果达到则PSO计算结束,输出最优值;如果未达到则重复步骤4。
  步骤7:将PSO找到的参数C、g代入SVM模型重新训练,得到较优的SVM模型。
  步骤8:利用svmpredict函数进行预测、mapminmax函数将结果反归一化,得到水工隧洞施工成本预测结果。
  2.4 预测结果分析指标   选取平均绝对百分比误差(MAPE)和均方根误差(RMSE)作为预测结果分析指标。MAPE与RMSE计算公式分别为
  MAPE=1N∑Ni=1yi-y*iyi×100%(11)
  RMSE=1N∑Ni=1(yi-y*i)2(12)
  式中:N为样本数目;yi和yi*分别为第i个样本的实际值与预测值。
  3 案例分析
  3.1 水工隧洞成本数据收集
  共收集了22个水工隧洞工程项目的成本数据,根据表1对原始数据进行量化,结果见表2。为了验证基于PSO-SVM的水工隧洞项目成本预测模型的可靠性和准确性,将22个水工隧洞样本分成两组,其中前18个为训练集,后4个为测试集。
  3.2 基于SVM的成本预测
  利用Matlab软件的mapminmax函数对成本影响因素量化结果进行归一化处理。利用libsvm软件包中的svmtrain函数创建和训练SVM模型,其中SVM模型使用v-SVR的默认参数,利用libsvm软件包中的svmpredict函数进行预测,利用函数mapminmax反归一化,结果如图2所示。
  3.3 基于PSO-SVM的成本预测
  利用Matlab软件的mapminmax函数对成本影响因素量化结果进行归一化处理;设定PSO的参数,D=2,n=30,c1=1,c2=1.5,ω=1,C∈(0,200),g∈(0,500),F(GkbestiD)=MAPE≤5%,最大迭代次数为500。通过PSO工具箱进行SVM的参数寻优,输出的最优参数值为C=2.426 5、g=0.010 0,其适应度函数如图3所示。由图3可知,预测误差在迭代20次后趋于稳定,在迭代92次时MAPE≤5%。
  将PSO工具箱寻优结果代入SVM模型中,利用svmpredict函数进行预测,利用mapminmax函数反归一化,结果如图4所示。
  3.4 预测结果分析
  PSO-SVM模型的MAPE为4.98%,RMSE为1 930.07万元;SVM模型的MAPE为10.79%,RMSE为3 456.47万元。对比SVM模型的预测结果发现PSO-SVM模型预测的MAPE和RMSE更小,预测更准确。原因是SVM模型预测时使用的是默认参数,最终解可能为局部最优而非全局最优,而PSO-SVM模型中粒子群算法会随着测试样本的输入而动态搜寻支持向量机的最优参数,能够保证预测精度并尽量避免过拟合。
  PSO-SVM及SVM模型的绝对误差如图5所示。由图5可知,PSO-SVM模型比SVM模型具有更强的能力。PSO-SVM模型的误差较小,其最大和最小绝对误差分别为6.7%和3.8%,而SVM模型的误差较大,其最大和最小绝对误差分别为14.9%和7.8%。
  对比PSO-SVM及SVM模型的训练速度可知,PSO-SVM模型的训练速度较快,最快和最慢训练时间分别为1.5 s和1.9 s,SVM模型的训练速度较慢,最快和最慢训练时间分别为7.8 s和10.6 s。
  4 結 论
  从工程、环境、市场、管理4个方面分析并量化了水工隧洞成本影响因素,建立了基于PSO-SVM的水工隧洞施工成本预测模型。基于22组水工隧洞工程施工成本数据,利用PSO算法对SVM的参数寻优,得到最优C值为2.426 5,最优g值为0.010 0,建立了基于PSO-SVM的水工隧洞成本预测模型,在Matlab平台上进行预测,得到其MAPE为4.98%,RMSE为1 819.55万元。预测结果表明,与SVM相比,PSO-SVM算法能够在较短的时间内更精确地预测出项目成本,且PSO-SVM模型具有较高的泛化性能。
  参考文献:
  [1] 秦中伏,雷小龙,翟东,等.基于SVM和LS-SVM的住宅工程造价预测研究[J].浙江大学学报(理学版),2016,43(3):357-363.
  [2] ZHANG Y,FANG S. RSVRs Based on Feature Extraction:a Novel Method for Prediction of Construction Projects Costs[J]. KSCE Journal of Civil Engineering,2019,23(4):1436-1441.
  [3] 李静,张卓群,李旭.基于GA-SVM的输电塔结构基础施工成本预测[J].施工技术,2016,45(12):100-102,114.
  [4] 乔国华,郭路遥,吴一敌,等.基于遗传优化最小二乘支持向量机的变电站全寿命周期成本预测模型[J].中国电力,2015,48(11):142-148.
  [5] 刘飒,万寿义.高新技术企业研发成本的预测模型及方法探讨[J].大连理工大学学报(社会科学版),2021,42(2):42-49.
  [6] 黄敏,吴立,姚沅.基于支持向量机-粒子群算法的山区公路隧道造价预测[J].公路,2015,60(7):285-288.
  [7] 高昆仑,刘建明,徐茹枝,等.基于支持向量机和粒子群算法的信息网络安全态势复合预测模型[J].电网技术,2011,35(4):176-182.
  [8] 刘必君,叶雨辰.基于栈式降噪自动编码器的建筑工程施工成本预测[J].同济大学学报(自然科学版),2020,48(6):922-928.
  [9] 王颖慧,苏怀智.基于PCA-GWO-SVM的大坝变形预测[J].人民黄河,2020,42(11):130-134.
  [10] 卢睿,李学伟.工程建筑企业投标中的项目成本预测研究[J].铁道工程学报,2016,33(6):104-109.
  [11] 李万庆,陈佳琪,孟文清,等.基于BSA-ELM模型的建筑工程施工成本预测研究[J].数学的实践与认识,2019,49(23):10-17.
  [12] AI D, YANG J. A Machine Learning Approach for Cost Prediction Analysis in Environmental Governance Engineering[J].Neural Computing and Applications,2019,31(12):8195-8203.
  [13] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10.
  [14] 黄梦婧,杨海浪.基于PSO的SVM-ARIMA大坝安全监控模型[J].人民黄河,2018,40(8):149-151,156.
  [15] OCK J H,PARK H K.A Study on the Algorithm of Cash Flow Forecasting Model in the Planning Stage of a Construction Project[J].KSCE Journal of Civil Engineering,2016,20(6):2170-2176.
  【责任编辑 张华岩】
其他文献
为研究半椭圆管水平降膜厚度的分布规律,搭建逆向气流条件下水平降膜实验平台,并结合数字图像处理技术,研究逆流风速(0-5 m/s)和喷淋流量(0.025-0.221 L/min)对液膜厚度的影响。研究表明:逆向气流会对管外水膜产生影响,并存在临界速度;当逆流风速低于临界速度,液膜厚度沿圆周方向先减小后增大,与无空气流动时相似;当逆流风速超过临界速度时,液膜分布严重不均甚至被吹飞;随着逆流风速增大,平均液膜厚度先增大后减小;随着喷淋流量增大,平均液膜厚度持续增大;当喷淋流量减小、逆流风速增大时,平均液膜厚度减
为了提高圆盘泵的水力性能,以径向直叶片圆盘泵为研究对象,结合计算流体动力学方法(CFD)与响应面分析法,研究叶轮结构参数对泵扬程和效率的影响。以叶片高度、叶片数量和盘间距为优化设计变量,泵的扬程和效率为响应变量,基于Box-Behnken样本点设计法进行三因素三水平设计,建立17组样本点。通过ANSYS CFX数值计算软件对各个样本点的设计模型进行数值模拟,并基于二阶响应面回归方程拟合了叶轮结构参数与扬程和效率之间的关系表达式。研究结果表明:叶片高度、叶片数量和盘间距均对泵的水力性能有明显的影响。多因素交
长期以来,黄河一直是文人墨客讴歌赞美的对象.唐朝作为诗歌发展的鼎盛时期,涌现了一大批名垂千古的优秀诗人,他们写尽了祖国的大好河山,其中自然也包括对黄河的描写.黄河在唐
期刊
水体污染是环境污染的常见形式之一,水体被迫接受的污染源越多,其中包含的污染物成分就会越复杂,治理就更加困难.《水体净化与景观水生植物工程应用》一书针对水体植物在环境
期刊
为了研究基于燃气轮机模型的先进控制算法和故障诊断技术,需要建立准确性和实时性更好的燃气轮机实时模型。采用基于模型的设计方法,在Simulink中建立燃气轮机分段线性化实时模型,通过代码生成技术和封装技术,将模型集成在南京航空航天大学航空发动机/燃气轮机全数字仿真平台和硬件在回路平台。在硬件在回路仿真试验中,燃气轮机实时模型与非线性模型的最大相对误差不超过3%;单位步长内,实时模型在数字电子控制器中计算平均耗时为0.126 ms,最大耗时为0.131 ms,精确性和实时性均满足控制系统的要求。
为了对燃气轮机进行有效的气路状态监测和故障诊断,提出一种基于模拟退火与粒子群混合优化的燃气轮机气路故障诊断新方法.采用快速模拟退火算法设计粒子生成器,用生成的初始
以某1000 MW八角双切圆锅炉为研究对象,采用数值模拟方法分析了分离燃尽风(SOFA)水平摆角对炉膛出口烟气温度、速度以及炉内主要燃烧产物分布的影响。结果表明:将SOFA水平摆角正向增大5°时可同时降低CO与NOx排放量;正向增大SOFA水平摆角,即SOFA正旋切圆直径增大,炉膛出口两侧逐渐出现双峰型高温烟气区,烟温偏差有所增大,而烟气高流速区则向炉膛出口中部移动;反向增大SOFA水平摆角,即SOFA反旋切圆直径增大,炉膛出口烟气温度和速度分布的不均匀性均有所减小。
光伏发电大规模并网给电网的稳定运行带来巨大挑战,提高光伏发电功率预测水平对光伏能源并网安全具有重要意义.光伏发电系统功率输出具有明显的非线性、间接波动性和不确定性
摘 要:針对三义寨引黄灌区主要作物需水量、有效降水量和净灌溉需水量的计算问题,采用参考作物法构建模型,采用联合国粮农组织推荐的彭曼-蒙特斯(Penman-Monteith)公式的修正公式进行计算。以惠北水利科学试验站观测数据为基础,得出冬小麦全生育期(10月中旬至第二年5月下旬)的作物需水量2000—2019年年际变化范围为395.494~796.776 mm,均值为579.425 mm,有效降水
提出一种基于燃烧与水动力耦合模型的锅炉蒸汽管壁温度数值模拟方法,对某660 MW超临界切圆燃烧锅炉壁温进行了计算分析。以均匀外壁温为边界条件,利用Fluent软件模拟了煤粉气固流动、燃烧和辐射等过程,获得了炉内不同位置受热管的传热热流。再以热流分布为边界,采用MATLAB软件建立了工质流动及气-壁-汽换热方程组,Fluent软件重新计算的壁温边界。通过编写模型间的网格映射函数,实现壁温的耦合计算。研究表明:壁温计算值与实测值的最大相对误差在2%以内;炉膛出口残余旋转使水平烟道左侧和右上方热流较大,高温再热