基于视觉分析的河道漂浮物检测与跟踪方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liongliong447
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
河流作为水环境中的重要组成部分,在供给水源、维持生态、美化景观等诸多方面扮演着不可或缺的角色。但是,目前人类活动和自然因素导致河面频繁出现大量漂浮物,严重破坏了河道景观和水生态环境,已成为河道监管中重点关注的问题。在国内各省市全面推行落实“河长制”政策的背景下,很多地方开始采用摄像头进行河湖可视化监管以促进河湖面貌改善,但是人工参与程度依然较高,单纯依靠人力观看大量的监控资料来判断河湖状况。在这种情况下,推动当前河道视频分析的智能化与无人化已成为河流长效管护的迫切需求。但是,河流环境本身复杂多样,例如,河流结构性差、易受动态光影和水波扰动等噪声的影响,现有的视觉方法应用至水面漂浮物监测任务中仍存在一些问题需要解决。围绕上述需求及难点,本文开展了基于视觉分析的河道漂浮物检测与跟踪方法研究,并进行了实验应用。主要工作与研究成果如下:(1)研究了复杂河道场景中的水体提取方法。针对河道外观多样和水面存在倒影、阴影及强光反射等干扰,传统算法难以实现水体区域准确检测的问题,提出了基于图像级联分割网络结合条件随机场的水体提取算法。该方法采用视觉任务中语义二分割的思路,通过多层神经网络提取图像中高层次的语义特征实现水体区域的初步提取;然后,将分割网络的输出结果作为一阶势辅助构建条件随机场模型,通过对像素点间的依赖关系进行建模,消除小区域误判并细化水体边界,实现水体提取结果的进一步优化。实验验证了所研究的水体提取算法在倒影、阴影和强光反射等复杂河道中的有效性,为后续工作提供了良好的支撑。(2)研究了时空信息融合的河道漂浮物检测方法。针对河道中闪烁光影、水流波动等噪声造成误检率高以及间歇性运动的漂浮物易漏检的问题,提出了基于时空域信息融合的漂浮物检测方法。在时间域,采用像素级别自适应分割算法,通过对河道背景模型复杂度进行建模,自动调整漂浮物决策阈值和背景模型更新率,来削弱动态背景噪声的影响;在空间域,使用谱残差算法分析单帧图像的全局空间显著性,获取漂浮物的显著性信息;然后,通过将时空双域信息融合,进一步降低漂浮物的误检率。同时,对像素级别自适应分割算法做出改进,加入漂浮物前景统计策略,改善间歇性移动的漂浮物易出现漏检的问题。实验验证本文算法提高了在动态背景噪声场景和目标间歇性运动场景中漂浮物检测的准确率。(3)研究了改进核相关滤波的河道漂浮物跟踪方法。立足于河道监控场景的特殊性,在传统核相关滤波(Kernel Correlation Filter,KCF)算法上做出改进,提出了多特征融合的尺度自适应河道漂浮物跟踪方法。通过同时提取目标的方向梯度直方图特征和颜色命名特征,来降低KCF跟踪算法对漂浮物跟踪时单一特征表征能力不足的影响;并利用跟踪置信度自适应调整不同特征响应图的权重,扩大跟踪算法在不同河道环境中的适用性;另外引入金字塔尺度估计策略实时估计漂浮物的尺寸,改善传统KCF算法无法进行跟踪框尺度调整而导致跟踪精度降低的问题。通过实验结果对比与定性定量分析,验证了本文算法在光影变化、水波扰动和运动旋转等条件下可实现对漂浮物的连续跟踪。(4)完成了河道漂浮物智能监测平台的设计与实现。对基于视觉分析的河道漂浮物检测与跟踪系统进行了需求分析,并完成了整个系统的设计和实现。河道智能监测系统由视频监控平台和算法功能模块组成。视频监控平台基于Java语言开发,采用了 Spring MVC框架和MySQL数据库,用以实时展现河道视频数据;算法功能模块基于Python语言开发,使用了 Open Source Computer Vision Library计算机视觉库和TensorFlow深度学习框架,用以进行视觉分析和提供算法接口。最终利用Docker将软件平台与算法模块部署至服务器上。综上所述,本文针对视觉分析在河道智能监控中实际应用的难点,研究了复杂河道环境中漂浮物智能监测方法,主要包括复杂场景中的水体区域提取算法、动态背景噪声下漂浮物检测算法和河面漂浮物跟踪算法,并在算法研究的基础上,设计了河道漂浮物智能监控平台。本文的研究成果将对推进河道环境智能无人化监测与河道自动化清理工作提供解决方案与技术支撑,同时也对其它领域中复杂条件下的目标检测和目标跟踪任务具有一定的借鉴意义。
其他文献
[db:内容简介]
无限带宽(InfiniBand)网络凭借高带宽、低延迟、易扩展的优势被广泛应用于数据密集型和计算密集型场景,加速了数据中心与高性能计算的发展。无限带宽网络集中式的管理架构要求高层管理软件实体通过特定的管理消息向网络节点传达管理指令。各网络节点通过管理代理这一底层软件实体响应网络管理行为,实现稳定、可控的网络环境。因此,本文基于CPU+FPGA组成的异构多处理器片上系统,提出了一种应用于嵌入式主机通
人体行为识别技术在智慧城市安防、视频检索、人机交互、无人便利超市等领域中有诸多应用,其重要性日益突出。如何有效地对视频序列信息进行时空建模是人体行为识别任务中的一个关键点。许多研究为了更好地对视频序列进行时空建模,采取三维卷积并结合光流等其他运动补充信息的方法,但忽略了所带来的网络难以优化、网络规模与计算量增加的问题。此外,在面临不同行为实例的持续时间长短不一的问题时,许多研究简单地堆叠局部感受野
[db:内容简介]
信息技术的快速发展和广泛应用,为机关档案管理模式创新提供了重要支持,特别是机关数字档案室建设成为其重要目标和内容,但也对机关数字档案信息安全提出了严峻挑战。文章分析了机关数字档案管理的特点,针对机关数字档案室建设中的安全风险点,提出具体安全管理策略,为机关数字档案室信息安全体系建立提供参考。
车辆重识别技术是安防、监控视频分析与理解的基础技术,也是构建天网工程、平安城市的重要环节。根据训练数据是否含有人工手动标注的标签,可将车辆重识别问题分为全监督车辆重识别问题和无监督车辆重识别问题。全监督车辆重识别任务面临着近相似的问题,本文针对该问题,设计并实现了一种基于局部特征和属性信息的全监督车辆重识别方法。与此同时,无监督车辆重识别任务面临着数据集歧视和难以训练的问题,为了解决以上两项问题,
CT图像肺部气管和血管分割对于肺部疾病的诊疗具有重要的研究意义。传统的分割方法基于边界、区域或特定模型进行图像处理,针对肺部密布的血管丛或气管树分割任务,必须依赖大量的人机交互才能提升分割精度。为保障自动分割精度,并提升分割效率,近年来深度神经网络作为特征提取工具逐渐在肺部血管或气管自动分割中得到应用,但因其效果受标注数据质量和规模的严重影响,限制了此类方法的推广。为解决这一问题,本文提出一种基于
稠密高程地图构建对于移动机器人星面探测、野外搜索等任务应用有着重要的作用,但是稠密地图构建存在数据量大、计算量大的难点,这对大范围地图存储和实时地图更新带来了巨大的挑战。本文基于2.5D稠密高程地图表示形式,提出了带有可行域信息的局部稠密高程地图快速构建系统、满足回航需求的可扩展全局一致的全局稠密高程地图在线构建系统和利用稠密高程地图的地点重识别融合网络。主要研究成果如下:1.设计了一种带有可行域
面向工业巡检的数字仪表读数识别普遍利用人工识别并记录仪表读数信息的方式,然而人工方式记录读数是影响工厂生产效率的重要因素。当工厂使用人工抄表,不可避免出现记录错误读数,耗时长等问题。因此,利用巡检设备自动优化记录过程,提高生产效率,并为记录读数提供准确保障。本文分析了工业巡检中数字仪表读数识别的影响因素,并根据工业巡检的功能和性能需求,设计了一种能够实现工业数字仪表读数实时识别的方案。本文利用巡检
作为机械臂操作的“圣杯”问题,无序抓取应用场景广泛,而稳定快速的物体识别和位姿估计算法则是该问题中的关键之一。本文针对无序抓取场景,应用基于物体渲染的样本合成方法,在已知物体CAD模型的基础上,合成大量训练数据,构造虚拟数据集,采用Mask R-CNN网络实现了堆叠场景的多工件识别与分割。在获取单目标工件数据后,提出了基于点对特征的改进算法,并且针对传统算法实时性差的问题,提出了基于深度学习的密集