基于深度学习的图像语义分割研究

被引量 : 0次 | 上传用户:guhong_2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的语义分割一直是计算机视觉领域的研究重点,而深度学习是近阶段人工智能方向飞速发展的热点,因此基于深度学习的机器视觉方面的应用随之成为全世界研究人员的热点关注问题。深度学习的发展近十年来在人工智能领域取得了非常具有建设性的突破,也是现阶段互联网大数据环境下最流行的智能应用方式之一。深度学习在图像检索、图像内容分析、自然语言处理、视频行为分析、多媒体解析等诸多宽广的领域上取得了引人瞩目的成功应用。接踵而至,各种各样的计算机视觉问题都在尝试使用深度学习的方法来进行更为突破性的研究。本文重点研究基于深度学习的卷积神经网络的图像语义分割。研究一是针对室内场景的图像通过原始图片的上下文信息约束来提高整体的像素级别的分割精度。研究二是将语义分割作为导向使用条件对抗网络得到像素级别上更精准、像素间更具相关性的分割结果,也是利用条件对抗网络来处理图像分割问题的研究尝试。首先介绍了传统方法与深度学习方法在图像语义分割任务上的差异,以及当下最热门的对抗学习方式和其中主要的生成对抗网络的介绍。主要分析了深度学习中卷积神经网络在图像语义分割任务上的优势,以及生成对抗网络在图像语义分割任务上的可行性与优点。室内场景的语义分割有很大的应用范围,例如智能机器人、室内监控等,但由于室内场景中的物体类别繁多且分布不均匀,当分割较小的物体或物体边缘时很容易丢失标签。图片的上下文信息表达的是像素点之间的关联内容,这些内容之间的约束能对语义分割结果产生有效地帮助,但目前的研究还有很多尚未充分利用的地方。本文对此提出了一个可学习的上下文正则化深度卷积神经网络模型,该模型利用卷积神经网络的特征提取能力得到原始图片中丰富的上下文约束信息,用以加强语义分割结果。该正则化模型使用深度卷积分割网络,但不引起明显的额外参数增加网络训练负担。提出的模型利用室内场景物体固有的上下文正则约束提高分割结果,可学习的约束是在网络低层和网络高层之间架起一个连接桥,在相邻的RGB像素点使用L1约束学习上下文约束信息来辅助高层的像素点分类以提高分割精度。基于深度卷积神经网络语义分割的研究也越来越深入且取得了显著的效果。生成式对抗网络(GANs)是深度学习领域最新提出的比较重要的一个模型,但现有的主要研究大多是针对图像生成、风格转移等任务,在图像分割上的研究还不够深入。因此本文使用生成对抗模型来研究和解决图像语义分割任务,提出分割-对抗模型(Conditional Segmentation Generative Adversarial Networks,CSGAN)。CSGAN使用深度卷积语义分割模型作为生成模型,基于输入的RGB图像产生对标签类预测的概率图,逐像素计算回归损失。CSGAN模型中的判别网络对预测图与标签图的差异进行高阶规律统计,为生成模型提供了一个自学习的全局损失统计方式,不依赖人工设计的损失项.。我们的模型保持了传统语义分割模型端到端的训练,实验结果有效地表明我们的模型不但能提高分割结果中单个物体的完整性,还能保持物体间的相互独立性。本文中针对室内场景的可学习的上下文正则化深度卷积神经网络模型在室内场景的数据库NYUDv2上对RGB图跟深度编码图HHA进行实验取得了精度上和分割边缘的有效提升。基于分割导向的条件对抗网络有效的认证了分割网络在对抗学习上的有效性,在数据库Cam Vid上进行了二类、十二类分割任务的实验,对抗学习的方式保持了深度学习分割网络的端到端的便捷属性,同时联合训练提高了分割的像素点间的相关性。
其他文献
党政主要领导干部位高权重,处于领导核心地位。近年来,领导干部腐败问题的不断发生已经成为社会最为关注的话题之一,究其根源,就是因为客观存在着大量滋生腐败现象的土壤和条
本文以通道县芋头侗寨为研究区域,在识别鼓楼、风雨桥、寨门、萨坛、布局形态、图腾标志、环境因子等9个景观基因的基础上,从环境要素感知和文化心理认同的角度进行问卷及访
"为官不为"问题已经引起各级党委、政府的高度重视。习近平总书记多次直面这一问题,并要求各级党委、政府下大力气认真加以解决。李克强总理在今年的政府报告中强调:要坚持主
北川羌族自治县永昌小学在"新基础教育"理念、方法的指引下,着力于课程、师资、课堂、综合活动四个关键要素,不断探索、寻找小学现代化建设的"四新"路径。在尝试中前行,坚定
根据霍夫斯塔德的文化层面理论,通过对中国广东省外商投资企业中的中外员工进行随机抽样调查,分析了中外员工文化价值和工作满意度之间的关系。在数据分析上突破了霍夫斯塔德
职业价值观是影响高职学生对职业的评价、选择与发展的重要因素,同时也是影响高职院校人才培养质量的关键性因素。分析目前高职学生职业价值观的现状,研究相应对策,并帮助高
实践证明地震是可知、可测、可预报的,探索地震奥秘是一项复杂的系统工程,需要实行科研方法论的转换。
<正> 什么是《红楼梦》的美学风格?六十年前,俞平伯先生答道:怨而不怒。可是这个答案在三十年前却受到“政治性围攻”。但棍棒产生不了学术创见,也打杀不了学术创见,正如一九
抑郁的躯体化是借助于身体这一媒介,对情绪的表达方式之一。对于抑郁躯体化及其影响已有了一定的研究基础,大量研究证实了抑郁躯体化妨碍了抑郁诊断,并从某些角度探讨了影响
随着高等教育的快速发展和高校学生在校规模数急剧增大,高校财务管理工作变得更为复杂。特别,随着财务数据信息量的增大,传统人工管理方式,已无法满足当前财务管理需要。以规