基于深度学习的河道场景语义化解析

来源 :温州大学 | 被引量 : 0次 | 上传用户:qmdx521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
河道航拍图像包含水环境以及沿岸陆地环境等信息,已有的航拍检测方法所产生的结论不能准确、直观的反映场景信息。因而本文提出采用卷积网络自动提取图像特征,通过长短时记忆网络将图像特征转换为文本语言,让航拍河道图像的分析过程变得精确、快速,为公众提供直观可靠的场景目标信息。本文具体工作如下:(1)采用无人机采集约100小时(4T)的河道场景视频,提出河道场景检测的10类目标以及评价标准,制作了相关位置标签数据集和语义数据集用于后续深度学习实验。(2)设计框选目标检测网络,检测河道场景中的目标位置以及种类,并针对河道场景的特点优化网络结构:增加了上采样层用来提升定位精度;减少了部分卷积层,添加相应的泛化层,用来加快检测速度;增加了邻近位置惩罚项,限制不合理的位置标签信息,提升分类精度。(3)提出了基于LSTM单元的语言生成网络,能自动地学习语料库语句,通过增加泛化层以及ReLu激活函数使语言网络能生成较为流畅、简洁的英语短句。(4)通过编码-解码的形式将图像网络和语言网络链接成端对端的语义检测网络,并增加的匹配惩罚项,使生成的句子更加贴近图像内容,实现了图像到文本语言的精准翻译。实验结果表明:目标检测模型能对10种河道场景目标进行分类和定位。优化后的网络结构,相较于原网络显著提升了检测效果,其平均分类精度达到了83%,交并比达到62%。端对端语义网络生成的语句表述流畅、长度适中,能如实、精简的描述图像区域内容。
其他文献
随着我国各行各业近年来的蓬勃发展,各种工业控制系统在生产过程中得到了广泛的应用,但由于各企业建设时期的不同及采用标准规范的不统一,致使不同形式的各种工业控制系统之
随着人类社会的迅速发展,信道传输环境越来越复杂,信号传输过程中由于时间选择性衰落和频率选择性衰落的影响导致信号失真,通信系统的传输性能受到较大影响。因此需要分析信
近些年来,随着计算机视觉的发展,运动目标检测与跟踪技术在军事、交通、环境监控等领域得到了广泛的应用。基于摄像机固定条件下的运动目标检测与跟踪技术已经逐渐成熟。然而
由于科技的高速发展,生物数据正处于爆炸式增长的时代。从复杂、高维的生物数据中挖掘出有价值的信息对于研究问题的本质具有重要意义。特征选择是处理高维生物数据的一种有
基于单词共现模式,传统主题模型能够从长文本数据中提取高质量的主题信息。对于短文本数据,文档的长度较短,单词之间的共现性信息较少,导致传统主题模型并不能很好地工作,无
作为惯性导航系统的重要部件,液浮陀螺仪提供基准坐标系,其性能和精度直接影响系统的性能和应用精度水平,具有精度高、寿命长、可靠性高等优点,在航空、航天、航海等军民领域
国际汉语教育不同于国内的语文教学,汉语教师不仅要提高学生汉语水平,更承担着传播中国文化的重要使命。但由于跨文化教学的桎梏,目前对外汉语教学中语言教学与文化教学存在脱节现象,产生了重语言教学而轻文化教学的现象。本文以中国面食文化作为对泰汉语教学中文化教学的研究窗口,力图展示当前重视文化教学的必要性和复杂性,并分析当前汉语教学中文化教学所面临的困境。针对这种困境,本文以面食文化为切入点,整合已有的汉语
市场经济时代,创新是企业保持竞争力的核心和灵魂。在企业生存环境动态性不断加剧,产品生命周期不断缩短的背景下,破坏性创新作为一种颠覆性的创新方法为新兴企业赶超市场主
伴随着各类用户对超清影像,VR以及3D游戏等图形处理产品卓越性能的追求,人们对图形处理器性能的要求也逐步提高。GPU通常作为一种用于图像运算的微处理器用于PC、游戏机、工
视频序列中的人体行为识别作为机器学习领域的热点和难点之一,已经引起了认知科学、生物学以及计算机科学等各个学科的广泛关注,同时,已成功应用于视频监控、零售分析和医疗