论文部分内容阅读
供水管网是城市的关键基础设施,任何出现在供水管网中的污染都可能严重威胁到城市居民的饮用水安全,因此,可靠的污染监测系统对供水管网而言至关重要。本文基于供水管网中传感器在线采集的水质数据,着重研究了供水管网中水污染检测与水污染溯源相关的方法,以期为供水管网的污染监测系统的建设提供理论上的指导。在污染的检测方面,本文研究了如何根据单个监测点返回的传感器数据,判断该监测点位置是否有污染发生。本文将这个污染检测的问题视作一个二分类问题,并尝试通过从历史水质数据中学习一个可靠的二分类器来解决这个问题。由于供水管网中真实发生的污染极少,所以在训练分类器时首先要考虑到训练数据集中存在的类别不平衡问题。针对这个问题,本文提出以固定比例对两个类别数据进行采样,从而保证模型训练时两个类别数据的相对均衡,进而避免模型对单一类别的偏向性。另外,考虑到时序信息在污染检测时的重要性,本文提出通过sequence-to-point的方法把一段时间窗口内的传感器数据与单一时刻水质状况关联到一起,从而达到提取有效时序特征的目的。最后,融合上述的两种方法,本文实现了一个用于水污染检测的长短期记忆网络模型。通过一个公开的真实水污染检测数据集,以F1分数为评价指标,本文验证了该模型的污染检测效果比当前在该数据集上表现较好的其他模型高出0.28以上。在污染溯源方面,本文研究了如何根据供水管网中所有监测点返回的传感器数据,对污染进行溯源。本文借助仿真工具EPANET对供水管网中水污染事件的模拟能力进行污染溯源的研究,并将溯源问题抽象为一个优化问题。为了解决这个优化问题,本文提出了一个基于深度学习与演化算法的两阶段污染溯源框架。该框架第一阶段使用深度学习模型对发生的污染事件进行污染源的定位,并给出供水管网中若干个较为可疑的污染源入侵节点。第二个阶段将第一阶段给出的可疑污染源入侵节点作为先验知识,通过一种双种群并行演化的演化算法来快速确定污染的开始时间、持续时间、污染强度等其他污染源相关的信息。实验表明,本文提出的结合了深度学习与演化算法的溯源方法相对于朴素的基于演化算法的溯源方法而言,在同样的时间约束下,搜索到的污染源信息更加接近真实的污染事件。