论文部分内容阅读
近年来,受水陆交通事故、工厂企业事故性泄露和违规排放、人为破坏、突发极端自然灾害等因素影响,我国水污染事件频发,对人们的生命财产安全和水生态环境系统的平衡造成了严重的威胁。通过流域水体水质监测信息,快速、有效、准确地对水污染进行追溯,以获知污染源项的必要历史信息(致污位置、致污量和污染传递过程),可为水污染事件风险评估、应急调控和生成处置预案、水环境监管等提供决策支持,将在水污染应急调控体系中发挥重大作用,而现有的水污染事件追踪溯源方法和技术仍面临追溯时效性差、追溯结果准确率不高以及数据利用不充分等多种问题,因此,采用可靠有效的追溯方法对水污染事件进行追溯研究是当前面临的主要问题。本文在分析国内外通过河流水质耦合模拟模型对水污染事件进行追溯研究的基础上,明确了使用机理模型进行追溯研究存在的一些不足:(1)在水环境监测中,不同污染源的相对位置和相对独立性,受行业监测范围的局限,难以扩展到监测范围以外,使得监测数据存在一定的滞后性;(2)受河渠水流与水体污染物混合扩散统计规律认知的局限,对于机理认识尚不清楚、相关关系定量描述困难的因素,难以在追溯方法中考虑等。基于此,本文提出了一种基于知识图谱关系推理的水污染事件追踪溯源方法,开展内陆河道水体污染追溯知识图谱的构建与应用研究。水体污染追溯知识图谱是利用领域知识图谱的理念模式,针对内陆河道进行水体污染追溯的知识进行整合,通过构建水体污染追溯本体,基于对象维度对水体污染相关的各类知识和追溯过程中涉及追溯推理的各类时空关系、语义关系进行形式化规则表达;通过水体污染追溯知识图谱数据层构建方法流程,对由多源采集的各类异构数据进行知识抽取和融合,提取满足本体规则表达的知识,形成统一的水体污染追溯知识库;以潘家口水库及其上游流域为实证区域,其水质监测数据中异常的水环境质量评价指标为水污染事件分析实例,根据水体污染追溯本体和知识库,构建水污染物产生传递关系链和潘家口水库及其上游流域水系实例知识图谱,以水质断面节点为推理的起止节点,参照水污染物的传递关系,通过匹配节点和路径完成水污染事件的追溯研究,并以后续的监测报告和遥感分析结果对本文追溯结果进行验证。论文具体研究内容和成果包括以下几个方面:(1)以领域知识图谱构建与应用指导下的水污染事件追溯研究为思路,首先,从产品生产与物流管理角度追溯的定义出发,提出了行业知识图谱角度下水污染追溯的基本原理;其次,总结了国内外内陆河道水污染事件的分类和成因,阐述了不同研究主题的水污染追溯数值模拟方法的研究现状;最后,介绍了领域知识图谱的发展,在地理信息、安保警务、旅游等领域的构建与应用现状,以及知识图谱推理的研究现状。分析了以水质监测、水动力学、污染物运移扩散物理模型与数值模拟等技术为基础的传统水污染追溯方法的不足,及行业知识图谱构建与推理在水污染追溯场景中的落地优势,明确了本文的主要研究内容和总体思路。(2)水体污染追溯知识图谱本体构建。从对象维度对水污染追溯领域知识进行界定、分解,形成单维多层的知识体系结构,以此作为水污染追溯模式层构建方面的概念模型,其中,水污染物、排污行业和污染源概念类用于描述水污染物的产生传递关系,地理信息和水文信息概念类用于追溯水污染物的活动过程和发生位置。在关系建模方面,基于水污染追溯知识体系结构进行概念间的层级、语义关系建模,并依据地理知识图谱,在地理信息和水文信息概念类中进行几何特征、空间关系(方位关系、拓扑关系和度量关系)的建模,形成水污染追溯领域知识的本体模式,为水体污染追溯知识图谱的构建提供规则化描述。(3)水体污染追溯知识图谱数据层构建。在水污染追溯领域实体与关系知识元抽取方面,根据数据结构特点,针对非结构化数据,实体知识元抽取采用基于深度学习的实体识别方法,关系知识元抽取采用基于深度学习的关系抽取方法;针对结构化数据,实体和关系知识元抽取通过D2R知识映射工具转换生成;针对半结构化数据,在数据预处理中,通过Python网页解析框架Beautiful Soup和正则表达式抽取实体和关系知识元。抽取完成的知识元通过本体融合工具进行知识融合,最后,将融合后的知识以图结构形式存储进Neo4j图数据库中,形成水体污染追溯知识图谱的知识库。(4)基于构建的水体污染追溯知识图谱对潘家口水库及其上游流域进行实例分析。根据构建的水体污染追溯知识图谱,提出水污染物产生传递关系链:“异常水环境质量评价指标→水污染物→排污行业→污染源”,确定了对污染源类型和排污行业类型进行溯源的方法;其次,根据潘家口水库及其上游流域水系源汇关系图的连接关系,构建图谱中的流域水系图谱结构,通过节点和路径匹配,对污染源位置进行溯源,完成水污染事件追溯研究的任务。本文的创新点体现在:(1)基于提出的水污染追溯的基本原理,利用知识图谱构建技术对水污染领域的知识内容和结构进行有效整合,构建水体污染追溯知识图谱对内陆河道水污染事件进行追溯研究;(2)将内陆河道水系(潘家口水库及其上游流域)进行子流域划分,构建流域水体污染源汇关系图,通过知识图谱构建技术将其转换为图谱结构,实现了流域水系地理结构向图结构的转换。以潘家口水库及其上游流域为实证区域进行水污染追溯,并通过后续的监测报告和遥感分析结果对追溯结果进行验证,肯定了领域知识图谱的应用模式与价值。