论文部分内容阅读
尽管福建省水资源相对丰富,但随着全省社会经济高速发展,区域水资源供需平衡差异性大,污染超标排放、垃圾处理、城市黑臭水体等水环境污染问题突出。本文以福建省为研究范围,在传统基于水环境基础数据、监测数据及统计数据的基础上,加入网络文本数据,利用“互联网思维”和数据挖掘技术,开展水环境的网络文本挖掘、敏感性评价分析研究,有利于帮助环保管理和决策者科学合理的制定水环境治理规划方案,对于水环境生态文明建设具有重要意义。主要内容包括:基于贝叶斯网络方法构建水环境网络文本识别模型来确定水环境网络文本及其污染类型;基于模糊层次分析法构建水环境敏感性评价模型来探究福建省各区县水环境敏感度主要影响因子及各敏感影响因子的空间分布特征。具体研究内容和成果如下:(1)采用基于页面的网络爬虫技术从互联网上采集获取2017年4-6月福建省内与水环境相关的网络文本数据,并对网络文本进行中分分词和空间化处理,结果表明水环境相关网络文本空间分布呈现闽东南沿海密集、闽西北内陆稀疏,东部主要分布在人口密集、经济发达区域,而西部主要沿主干河流走向分布;采用水质类别判别法对2017年4-6月福建省内水质监测数据进行水质评价,从各地区的水质监测指标达标率来看,南平市水质达标率最高、莆田市水质达标率最差。(2)基于贝叶斯网络的构建水环境网络文本识别模型,即利用已有知识和经验来分析网络节点变量之间的因果关系,确定贝叶斯网络结构,采用期望最大估计(EM)算法对训练样本数据进行参数学习,确定各网络节点变量的条件概率分布。与其他识别模型方法相比,该模型在总体精度、确定率及召回率方面都取得了较高的验证结果,在识别的动态性、高效性、稳定性及识别结论的可解释性等方面具有一定的优势,可以满足对复杂水环境网络文本信息及其污染类型的识别。(3)基于FAHP构建的敏感性评价模型能够直观地反映福建省各区县水环境敏感性及其空间分布特征。从污染敏感指数来看,全省敏感度闽南部地区高于闽北部地区,特别是闽西南和闽东南两侧地区,高敏感区分布较为零散,主要分布在汀江中下游、晋江下游和龙江等;从保护敏感指数来看,全省敏感度闽西北-中南地区高于闽东北-西南地区,高敏感区分布较为零散,主要分布在闽江上游支流建溪、木兰溪、萩芦溪等;从网络文本敏感指数来看,全省敏感度闽东部-中北部地区高于闽西部-中南部地区,高敏感区分布集中在闽江下游地区。综合各敏感指数分析来看,全省水环境敏感度从闽东南-西南-北部-中部-东北依次减小,高敏感区主要集中在东沿海经济发达区、河流入海口较为明显。