基于条件随机场的端对端图像语义分割算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ghchao0605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是为图像中每个像素点标注一个物体类别标签,它是人工智能研究的重要分支,已经应用于多个领域。例如,无人驾驶中的环境场景分割和医疗影像分析中的病变器官分割。随着深度卷积神经网络(Deep Convolution Neural Network,DCNN)在物体检测、分类和识别任务中取得较大进展,研究人员逐步尝试将DCNN的分类能力应用到图像语义分割任务。近年,研究人员利用编解码结构思想,设计了全卷积神经网络。在编码过程中,网络不断使用卷积和池化层提取图像高层次特征;在解码过程中,利用反卷积层恢复物体轮廓。由于编码的下采样操作会丢失图像信息,这导致解码的上采样对恢复物体轮廓细节的效果较差。密集型条件随机场作为分割后端处理部分,能有效修正前端的错误分割,但参数学习是独立的。针对图像语义分割任务,本文在研究端对端可训练网络基础上,设计并实现两种基于条件随机场的后端网络模块。由前端DCNN网络预测基础的像素概率,后端条件随机场网络结合图像局部先验信息修正预测结果。本文具体研究内容包括:(1)基于全连接密集型条件随机场的端对端可训练网络研究:为了构建网络,分析前后两端融合过程,前端网络仅使用DCNN,DCNN通过对图像处理产生初步预测的分数映射图,其中每点值表示该像素点被标注为某类物体的概率。后端网络模块基于条件随机场。在本文研究中,首先对密集型条件随机场模型构建方法和求解算法进行分析。接着,为了将模型融入网络,分析和分解算法步骤,并将其用网络层进行实现。最后,研究将整体迭代算法转化为基于条件随机场的循环神经网络结构(CRFRNN)的过程,融合前端网络和后端条件随机场模块,从而构建端对端网络。(2)基于两种高维高斯滤波的CRF-RNN实现研究:本文实现两种使用高维高斯滤波实现CRF-RNN模块。为了加速CRF-RNN模块中信息传递步骤的计算,首先利用Permutohedral Lattice方法加速模块的计算,Permutohedral Lattice方法通过splat步骤将输入特征映射到高维空间并分散输入值至晶格顶点,在blur步骤中对顶点上值使用分离高斯卷积,最后通slice步骤将顶点上值聚集并映射回原特征点上。为了更好传递信息,本文将blur步骤中的分离高斯卷积替换为可学习的分离卷积核。为了减少执行时间,进而使用Gaussian KD-Tree方法实现CRF-RNN模块。Gaussian KDTree方法根据输入特征构建树,在splat步骤通过特征查询将输入值采样到叶子节点上,在slice步骤通过特征查询将叶子节点上值聚合回原点。针对基于密集型条件随机场的端对端可训练网络,本文基于PASCAL VOC 2012数据集进行测试,具体包括:测试与分析基于Permutohedral Lattice方法且具有可学习卷积核的CRF-RNN模块;测试与分析基于Gaussian KD-Tree方法的CRF-RNN模块的。实验结果表明,本文设计实现的基于密集型条件随机场的端对端可训练网络,可将图像分割指标提升至72.6%,同时计算效率提升20%。
其他文献
通过研究、分析数据交换过程中的抽取、转换、加载的方法,选择符合广西电网公司信息系统建设现状的技术实现手段,结合营销数据变化的特点,构建出合理、稳定的数据传输通道和操作
员工满意度是组织管理的重要指标之一,是组织行为学中的热点问题。它不仅是衡量企业经营绩效的重要指标,也是企业改进业务流程、实现组织高效运作、提高用户满意度和用户忠诚度的强大动力。本文以大量的文献研究作为基础,针对近几年H公司出现业绩下滑和人才大量流失的问题,对H公司员工满意度现状进行分析、发现存在的主要问题并针对问题提出了优化设计。首先,本文通过文献研究法,收集大量的相关文献和理论基础,为本研究的前
本文时钢筋直螺纹连接技术的特点、现状进行介绍。并结合工程实践提出施工申的一些注意事项。对该技术今后的应用有一定借鉴作用。
本文通过对影响混凝土耐久性的因素的分析,综合介绍了混凝土结构耐久性检测的各种技术现状,希望对从事建筑结构检测的同行有所帮助。
为了更好地给广西节能发电调度工作提供技术支撑,对广西电网火电厂节能减排在线监测系统功能进行优化设计。通过借鉴其它电网节能减排在线监测系统的经验,并结合广西电网结构
分析一起500 kV油浸式电力变压器内部绝缘击穿故障。通过对故障变压器的油箱、高压套管及内部进行检查,并结合故障录波图进行分析,确定了放电主通道、放电诱发原因以及故障发