基于深度学习的图像语义分割算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wuaiboer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉因为其广泛的应用场景而被广大学者所关注,图像语义分割是计算机视觉领域中一项难度较大、实用性较强的技术。近几年来,由于智能移动终端的普及以及无线通信技术的不断发展,RGB图像数量的爆炸式增长使得图像语义分割的研究也进展得越来越迅速。深度学习(Deep learning,DL)最近在高级视觉任务中展现出了强大的性能,例如图像分类和目标物体检测。全卷积神经网络(Fully convolutional networks,FCN)提出之后,深度神经网络(Deep neural network,DNN)在图像语义分割问题上取得了质的飞跃。本文的目的就是设计一种高性能的图像语义分割算法来对图像进行语义分割,虽然目前大多数基于深度学习方法的图像语义分割技术已经取得了较大的成功,但是对图像中物体的定位还不够精确。因此,本文构造了一个深度神经网络模型,由一个深度卷积神经网络(Deep convolutional neural network,DCNN)和一个循环神经网络(Recurrent neural network,RNN)构成,对现在存在的问题做了一定程度上的改善。主要工作可以分为两个部分:第一,提出了一个用于特征提取的深度卷积神经网络。首先,在这个特征提取网络中利用了扩张卷积和下采样卷积技术,平衡了特征映射分辨率和感受野的冲突。然后,在这个深度神经网络中把卷积、扩张卷积、下采样卷积、批归一化等技术集成在残差模块中,构成了网络的基本单元,该网络在自身深度较大的情况下,不会有大的训练误差和测试误差。这个特征提取网络能获得多尺度的特征并能防止图像细节信息的丢失。第二,构建了一个端到端的用于图像语义分割的深度神经网络。首先,在深度卷积神经网络中加入多尺度特征融合技术,使得网络在训练和预测的过程中都有多尺度特征融合的参与,提高网络的精确度。其次,引入了将全连接条件随机场转化成循环神经网络的方法,将深度卷积神经网络和全连接条件随机场(Fully connected conditional random field)整合成了一个端到端的深度神经网络。这不仅使分割图的轮廓变得更加精细,也简化了训练流程,缩短了实验周期。本文提出的深度神经网络在公开的PASCAL VOC2012数据集中的图像语义分割数据集上得到了验证,并在其中的测试集上取得了mIOU为78.1%的成绩。
其他文献
9月5日,中到大雨;9月6日,连绵细雨。参与科技部、国家民委等11部委与湖南省人民政府主办“科技列车怀化行”的农业专家们,驱车前往位于湖南省西部、怀化市西北部的武陵山区国
随着我国经济由高速增长向高质量发展转型,金融业如何防范和化解存量风险、更好服务实体经济,成为政府和各类金融机构面临的共同难题。融资租赁企业作为积极参与国家金融服务实体战略的非银行金融机构,在当前金融改革和创新工作中发挥着重要作用。融资租赁企业如何优化资源配置、高效利用资产、创新金融工具,对融资租赁行业的长足发展及金融脱虚向实、助力我国经济转型具有重要意义。远东宏信作为我国融资租赁行业第一梯队企业,
随着全球经济的高速发展,现代项目管理的理念和方法已经深入各行各业。翻译行业也不例外,翻译项目管理作为一种高效的管理理念已经在翻译行业中得到广泛应用。“翻译项目管理”指项目经理按照客户的要求,在既定的时间内利用各种技术、工具和管理方法,理顺相关工作环节,保质保量地完成翻译任务,并将成本控制在合理的预算范围内。现在翻译行业的任务量很大,若要保质、保量、保时地完成翻译任务,必须要合理地利用翻译管理系统能
紫背天葵又称红背葵、观音苋,为菊科多年生草本植物。紫背天葵全株带肉质,根粗壮,茎直立,多分枝,再生能力强,嫩茎叶可食用,因其营养丰富,风味独特,鲜嫩茎叶和嫩梢的维生素C含
本文首先分析了在准军事化管理制度下飞行技术专业辅导员的工作特点,指出个体因素,家庭因素和组织因素是造成飞行技术专业辅导员产生职业高原现象的三大因素,并提出应该从个