基于遗传算法优化的RBF神经网络在MBR膜污染仿真预测中的研究

来源 :软件工程 | 被引量 : 0次 | 上传用户:yyn_8305112002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  1 引言(Introduction)
  水污染的预防和治理已成为当今世界日益严重的热点问题。膜生物反应器(MBR)作为一种将膜分离技术和生物反应技术相结合的新型高效污水处理技术,已被广泛应用于生活污水、有机废水处理等领域[1,2]。膜污染会影响MBR膜分离单元的性能,缩短膜的使用寿命,增加MBR系统的运行成本。因此研究膜污染的机理和预测控制方法,保证膜生物反应器能够在稳定的低耗能条件下获得较大膜通量是促进MBR推广应用的关键[3,4]。
  目前在MBR膜污染领域,常用的多种预测模型都存在一些缺陷,如对膜污染机理分析不够透彻,预测精度差等问题。人工神经网络在预测领域有比较成熟的应用,而相比较传统的BP神经网络,RBF网络具有唯一最佳逼近的特性且无局部极小值的问题,可以做更精准高效的预测分析[5-7]。再引入遗传算法优化RBF神经网络的相关参数,弥补单一径向基网络模型的缺陷,就可以实现对膜污染更精准的预测。
  2 RBF神经网络(RBF neural network)
  人工神经网络(Artificial Neural Network,即ANN),是由人工建立的,以有向图为拓扑结构的动态系统,它从信息处理角度对人脑神经单元网络进行抽象化,建立简单模型,按不同的连接方式组成不同网络。人工神经网络以其特有的非线性适应性信息处理能力,使之在模式识别、自动控制、人工智能、预测估计等方面都有成功的应用,表现出了良好的智能特性。
  径向基函数(RBF)神经网络是一种高效的前馈式神经网络,它由输入层、隐含层和输出层构成,具有其他前向网络所不具有的最佳逼近性能,并且结构简单,训练速度快。该神经网络采用RBF作为隐单元的“基”构成隐含层空间,将输入矢量直接映射到隐空间而不需要权值连接。当RBF的中心点确定后,映射关系也就随之确定。隐含层空间到输出空间的映射是线性的。
  径向基神经网络的网络结构如图1所示。
  RBF网络的激活函数采用径向基函数,以输入和权值向量之间的距离作为自变量,常见的隐含层节点的核函数为高斯函数。
  (1)
  其中,σ称为基函数的扩展常数或宽度,σ越小,径向基函数的宽度越小,基函数就越有选择性。
  3 遗传算法(Genetic algorithm)
  遗传算法(Genetic Algorithms,简称GA或GAs)是由密歇根大学Joho H.Holland教授及其学生于20世纪60年代末到70年代初提出的一种经典的智能算法。遗传算法是一种基于群体寻优的方法,具有全局搜索能力,初值无关性以及较快的收敛速度。具体过程如下:
  Step1:采用随机的方法或者其他方法产生一个初始种群。
  Step2:根据问题的目标函数构造适值函数(Fitness Function)适值函数用来表征种群中每个个体对其生存环境的适应能力。
  Step3:根据适应值的好坏,不断选择和繁殖,基因通过交叉和变异得到更新。
  Step4:若干代后得到适应值最好的个体即为最优解。
  4 遗传算法优化的RBF神经网络(Optimization of
  RBF neural network based on genetic algorithm)
  RBF神经网络具有最佳逼近性和全局最优性,可以实现对MBR膜通量较为精确的预测。但是为了更好地选取相关参数,引入遗传算法对RBF神经网络的参数进行合理优化,其中包含四个参数,分别是误差、训练速度、最大神经元数目以及神经元的间隔,经过遗传算法寻优后得到的最优个体即为进行RBF神经网络训练涉及的最优参数。GA-RBF神经网络模型完成网络训练后,再采用仿真数据检测评估该网络的优化性能。
  5 建立基于PCA的GA-RBF膜污染仿真预测模型
  (A simulation model of GA-RBF membrane
  pollution based on PCA is established.)
  5.1 采用PCA进行模型输入参数选取
  主成分分析(Principal Component Analysis,PCA)是一种掌握事物主要矛盾的统计分析方法,它通过矩阵特征值分析对初始数据进行线性空间投影,从多元事物中解析出主要影响因素,从而达到简化复杂的问题的目的。
  膜污染的影响因素众多,通过减少RBF网络的输入数来简化RBF网络结构,从整体上提高RBF网络的性能。初选的六个膜污染影响因子为X={总阻力,MLSS,操作压力,COD,PH,温度}。
  主成分分析法步骤为:
  Step1:把初选的六个膜污染影响因子组成矩阵X。
  Step2:对X数据标准化处理,得到标准化矩阵A。标准化后的数据阵每个列向量的均值为0,标准差为1,数据无量纲。
  Step3:计算出协方差矩阵S。
  Step4:计算协方差矩阵S的特征值λ与相应的特征向量u,然后将特征值由大到小排列得到特征值矩阵V和特征向量矩阵U。
  Step5:对特征值矩阵V分析,计算出贡献率,确定主成分。通常选取贡献率为85%—95%的m个主成分进行综合分析。
  通过计算选取出主成分贡献率在90%以上的三个污染因子即:MLSS、操作压力及温度,并以此作为RBF神经网络的输入层神经元。膜通量大小是表征膜污染程度的唯一指标,因此以膜通量作为RBF神经网络的唯一的输出层神经元。
  5.2 建立基于GA-RBF的膜污染仿真预测模型
  实验建立的GA-RBF膜污染预测模型如图2所示。
  实验步骤如下:   Step1:对RBF神经网络的四个参数编码,为方便操作设定误差、训练速度为实数编码,最大神经元数目、神经元间隔为整数编码,所有编码得到的基因位串称为一个个体。
  Step2:随机产生20个个体作为初始种群,构建初始的交配池。
  Step3:执行RBF网络训练,得到误差百分比作为每个个体的适应度。个体间基因进行交叉和变异,保证基因多样性。
  Step4:采用轮盘赌选择方式,筛选出适应度高的个体,淘汰掉适应度低的个体。
  Step5:重复进行(3)直到结束循环,得到的个体为最佳个体。
  Step6:训练完毕,最佳个体即为RBF网路最优的参数值,进行仿真测试,将实验数据与样本数据对比分析。
  6 预测结果与实验结果对比分析(Comparison of
  the predicted results with the experimental
  results)
  实验数据全部来自于石家庄市某MBR污水处理厂的实验以及工业生产的历史数据,统一采用的是孔径为0.2um的聚偏氟乙烯微滤膜处理污水方法。从实验数据中选取6组作为校验用样本,其余24组作为神经网络的训练样本。
  遗传算法操作的初始参数为:选择种群规模:sizepop=20;最大进化代数:maxgen=10;交叉率:pcross=0.8;变异率:pmutation=0.5.RBF训练误差范围是1e-4-1e-3;最大神经元数目范围值是80—150;显示神经元间隔范围值是10—30;速度范围值是10—25。
  试验中得到遗传算法代数与误差曲线如图3所示。
  图3显示了网络训练的误差随着遗传代数增加表现出来的变化趋势,随着进化代数增多误差降低,进化至第8代误差仅为0.02871,到第8代以后图像趋于缓和,基本已达到优化极限,实验收敛速度很快,优化效果明显。
  为更好地体现优化效果,实验使用相同的样本数据进行测试,设置遗传算法进化到10代,分别对RBF网络和GA-RBF网络进行训练。首先得到基于RBF神经网络的预测结果,如图4所示,RBF网络的训练结果平均误差值为0.1130,已经能够完成初步的膜通量预测。然后再进行GA-RBF网络训练,预测结果对比如图5所示,经过GA优化参数之后的预测模型平均误差值仅为0.0275.准确度有非常明显的提高。实验结果表明,经过遗传优化过的RBF神经网络误差明显减小,得到的训练结果明显优于优化前的结果,预测精度较为理想。预测误差数据分析见表1。
  7 结论(Conclusion)
  由于膜污染过程具有非线性、参数时变性、随机干扰等复杂的机理,造成预测研究过程十分困难,本文在用主成分分析法简化输入参数的基础上,建立了RBF神经网络仿真模型,实验取得了良好的预测效果,误差符合实验标准。由于预测精度是否准确很大程度上取决于网络模型参数的选取,因此引入遗传算法,优化RBF网络相关参数,建立基于遗传算法优化的径向基函数神经网络预测模型并成功应用于MBR膜污染仿真预测中,研究结果表明,遗传算法优化后的RBF神经网络不仅提高了预测速度,还明显提高了预测精确度,从而能更好地实验对膜通量的检测和控制。整个实验过程具有一定的理论价值和实践意义,对MBR实际工程应该可以起到积极的指导作用。
  参考文献(References)
  [1] Yu Zhang,et al.Risk Assessment of Giardia from a Full Scale MBR Sewage Treatment Plant Caused by Membrane Integrity Failure[J].Journal of Environmental Sciences,2015(04):252-258.
  [2] Kun Li,et al.Advanced Treatment of Municipal Wastewater
  by Nanofiltration:Operational Optimization and Membrane Fouling Analysis[J].Journal of Environmental Sciences,2016(05):106-117.
  [3] Hui Gong,et al.Membrane Fouling Controlled by Coagulation/Adsorption during Direct Sewage Membrane Filtration(DSMF)for Organic Matter Concentration[J].Journal of Environmental Sciences,2015(06):1-7.
  [4] 韩永萍,等.MBR膜污染的形成及其影响因素研究进展[J].膜科学与技术,2013(01):102-110.
  [5] 刘海萍.神经网络在CPI预测中的应用[A].中国管理现代化研究会.第五届(2010)中国管理学年会——市场营销分会场论文集[C].中国管理现代化研究会,2010:7.
  [6] Guo ShengPeng,et al.Task Space Control of Free-floating Space Robots Using Constrained Adaptive RBF-NTSM[J].Science China(Technological Sciences),2014(04):828-837.
  [7] 王芹芹,雷晓云,高凡.基于主成分分析和RBF神经网络的融雪期积雪深度模拟[J].干旱区资源与环境,2014(02):175-179.
  作者简介:
  汤 佳(1991-),女,硕士生.研究领域:MBR计算机模拟仿
  真,大数据与云计算.
  李春青(1962-),男,博士,教授.研究领域:MBR计算机模
  拟仿真,大数据与云计算.
其他文献
“逢会必跌”似乎成为A股市场逃不掉的魔咒。随着“两会”的召开,大盘本周前三个交易日出现向下调整,连跌三天,直到后半段才稍有起色。大宗交易市场上,3月2日-8日五个交易日中沪深两市大宗交易市场共发生145笔交易,较上周有明显增加。其中沪市44笔,深市101笔,总成交量3.03亿股,成交金额34.32亿元。  从交易个股来看,单笔成交金额最大的前三只股票分别为ST申龙(600401)、金隅股份(601
最近两周A股市场持续调整,上证综指截止本周四已经连续6个交易日运行在20日均线下方,而下档短期则受到半年线的支撑。后期大盘方向如何演变?这是众多投资者关心的问题。   从基本面来看,目前可以预期的利好消息并不多。地产政策放松的预期曾是2月底3月初反弹持续进行的主要动力,而“房价远未回归合理价位”一定程度上打破了这一预期。而目前看来,无论从管理层主观意愿还是地产行业客观景气看,都不存在调控放松的条
创客式教育是一种以"创造中学"为主要学习方式、以培养各类创新型人才为目的的新型教育模式,对高职院校学生创新创业能力培养有重要的促进作用。"互联网+"背景下,设计一种基于翻转课堂的创客式课堂教学模式,充分融合线上线下教学资源,并以物联网应用系统开发课程教学为例,展示开展教学的具体方案,实现创客教育与高职课程对接,为培养创新型人才提供教学参考。
本周三,美联储在始于去年9月的扭曲操作(OT)将要结束时,推了2.0版的扭曲操作,但时间显著缩短,数量也大大缩水。至于多方热盼的QE3却只字不提,市场非常失落,而之前如高盛等还言之凿凿称第三轮量宽QE3必出。现实与梦想之间的落差说明了什么呢?  首先,全球大放水的前景可能因此黯淡。量宽是直接向市场投放流动性,未必能帮助实体经济,但在推高商品价格、制造全球性通胀上倒是功勋卓著。联储不推,或不敢推QE
传统的实验实践教学模式以老师课堂讲解布置任务、学生按照实验指导书被动完成实验任务为主,不能充分发挥学生的学习主观能动性,不利于提高学生的自主学习能力。为此,很多学校正积极构建自己的网络教学平台,将网络教学作为课程教学的有益补充。本文以重庆邮电大学地理信息系统专业实验实践网络课程平台建设为例,将网络教学平台与实践课堂教学有机地整合起来,构建了基于Moodle平台的自主学习型教学模式。通过网络教学平台
简要地介绍了多种地下工程围岩稳定性分析方法,对它们进行了初步讨论,并对这一研究的现状与发展趋势做了评述。
SHA-1是一种哈希函数,它被广泛使用在电子商务这样的现代安全领域,特别是应用于数据加密通信、数字签名。很多的密码协议、标准中都包括了SHA-1算法,如著名的SSL、IPsec和PKCS。本文通过深入分析SHA-1算法及碰撞算法原理,找出SHA-1算法内部碰撞的原因,对算法中逻辑函数和压缩函数进行改进设计,得到基于局部碰撞算法的SHA-1改进算法。