基于深度学习的河道场景语义化解析

来源 :温州大学 | 被引量 : 0次 | 上传用户：qmdx521

【摘要】

：

河道航拍图像包含水环境以及沿岸陆地环境等信息,已有的航拍检测方法所产生的结论不能准确、直观的反映场景信息。因而本文提出采用卷积网络自动提取图像特征,通过长短时记忆

【作者】

：

方正

【出处】

：

温州大学

【发表日期】

：

2018年01期

【关键词】

：

河道检测场景标注目标检测语义化分析目标分类图像翻译

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

河道航拍图像包含水环境以及沿岸陆地环境等信息,已有的航拍检测方法所产生的结论不能准确、直观的反映场景信息。因而本文提出采用卷积网络自动提取图像特征,通过长短时记忆网络将图像特征转换为文本语言,让航拍河道图像的分析过程变得精确、快速,为公众提供直观可靠的场景目标信息。本文具体工作如下:(1)采用无人机采集约100小时(4T)的河道场景视频,提出河道场景检测的10类目标以及评价标准,制作了相关位置标签数据集和语义数据集用于后续深度学习实验。(2)设计框选目标检测网络,检测河道场景中的目标位置以及种类,并针对河道场景的特点优化网络结构:增加了上采样层用来提升定位精度;减少了部分卷积层,添加相应的泛化层,用来加快检测速度;增加了邻近位置惩罚项,限制不合理的位置标签信息,提升分类精度。(3)提出了基于LSTM单元的语言生成网络,能自动地学习语料库语句,通过增加泛化层以及ReLu激活函数使语言网络能生成较为流畅、简洁的英语短句。(4)通过编码-解码的形式将图像网络和语言网络链接成端对端的语义检测网络,并增加的匹配惩罚项,使生成的句子更加贴近图像内容,实现了图像到文本语言的精准翻译。实验结果表明:目标检测模型能对10种河道场景目标进行分类和定位。优化后的网络结构,相较于原网络显著提升了检测效果,其平均分类精度达到了83%,交并比达到62%。端对端语义网络生成的语句表述流畅、长度适中,能如实、精简的描述图像区域内容。

其他文献

多工业控制系统的优化及上层平台的设计与实现

随着我国各行各业近年来的蓬勃发展,各种工业控制系统在生产过程中得到了广泛的应用,但由于各企业建设时期的不同及采用标准规范的不统一,致使不同形式的各种工业控制系统之

学位

多工业控制系统上层平台设计与实现

时频双选信道环境下OFDM系统的信道估计技术研究

随着人类社会的迅速发展,信道传输环境越来越复杂,信号传输过程中由于时间选择性衰落和频率选择性衰落的影响导致信号失真,通信系统的传输性能受到较大影响。因此需要分析信

学位

正交频分复用时间选择性衰落频率选择性衰落基扩展模型最小二乘算法线性最小均方误差法卡尔曼滤波算法

旋转摄像下的运动目标检测与跟踪研究

近些年来,随着计算机视觉的发展,运动目标检测与跟踪技术在军事、交通、环境监控等领域得到了广泛的应用。基于摄像机固定条件下的运动目标检测与跟踪技术已经逐渐成熟。然而

学位

旋转扫描非线性变换图像补偿全景柱面公共坐标系

基于多角度融合的特征选择算法研究

由于科技的高速发展,生物数据正处于爆炸式增长的时代。从复杂、高维的生物数据中挖掘出有价值的信息对于研究问题的本质具有重要意义。特征选择是处理高维生物数据的一种有

学位

特征选择分类有效范围生物网络M-k-TSP

基于词向量信息的短文本主题模型研究

基于单词共现模式,传统主题模型能够从长文本数据中提取高质量的主题信息。对于短文本数据,文档的长度较短,单词之间的共现性信息较少,导致传统主题模型并不能很好地工作,无

学位

主题模型短文本数据词向量上下文信息

基于旋转模式的液浮陀螺仪误差系数标定方法研究

作为惯性导航系统的重要部件,液浮陀螺仪提供基准坐标系,其性能和精度直接影响系统的性能和应用精度水平,具有精度高、寿命长、可靠性高等优点,在航空、航天、航海等军民领域

学位

液浮陀螺仪误差模型标定旋转模式

中国面食文化在对泰汉语教学中的实践研究

国际汉语教育不同于国内的语文教学,汉语教师不仅要提高学生汉语水平,更承担着传播中国文化的重要使命。但由于跨文化教学的桎梏,目前对外汉语教学中语言教学与文化教学存在脱节现象,产生了重语言教学而轻文化教学的现象。本文以中国面食文化作为对泰汉语教学中文化教学的研究窗口,力图展示当前重视文化教学的必要性和复杂性,并分析当前汉语教学中文化教学所面临的困境。针对这种困境,本文以面食文化为切入点,整合已有的汉语

学位

对外汉语文化教学中国面食面食文化教学

基于QFD理论的破坏性创新技术实现过程

市场经济时代,创新是企业保持竞争力的核心和灵魂。在企业生存环境动态性不断加剧,产品生命周期不断缩短的背景下,破坏性创新作为一种颠覆性的创新方法为新兴企业赶超市场主

学位

破坏性创新质量功能展开质量屋顾客需求雷达图

面向OpenGL图形流水线的纹理载入单元设计与验证

伴随着各类用户对超清影像,VR以及3D游戏等图形处理产品卓越性能的追求,人们对图形处理器性能的要求也逐步提高。GPU通常作为一种用于图像运算的微处理器用于PC、游戏机、工

学位

OpenGL图形流水线纹理载入纹理更新纹理缓冲区纹理压缩

基于运动学描述子和深度学习的行为识别新框架

视频序列中的人体行为识别作为机器学习领域的热点和难点之一,已经引起了认知科学、生物学以及计算机科学等各个学科的广泛关注,同时,已成功应用于视频监控、零售分析和医疗

学位

行为识别深度学习运动学场注意力机制

基于深度学习的河道场景语义化解析

与本文相关的学术论文