基于注意力机制的图像语义分割方法

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:xpzcz1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化的时代,计算机视觉技术解决了计算机理解现实世界的重大课题。作为连接计算机和现实世界的纽带,图像语义分割技术(Image Semantic Segmentation)起到了至关重要的作用。当前,图像语义分割技术在无人驾驶领域、地貌监测领域和医学影像病理判断等领域都有着举足轻重的地位,但仍存在如感受野固定、语义预测不一致性等问题。现有的图像语义分割方法仍旧难以很好的对目标物体进行一致性预测,为了提高图像语义分割方法的整体性能和语义一致性,本文基于当前主流的主干网Res Net展开研究,主要的研究工作如下:1.讨论多尺度融合算法的局限性,对其中的多尺度信息获取方法进行展开分析,提出使用位置注意力机制联合双线性插值下采样的方式对给定特征图进行多尺度信息的采集。通过联合位置注意力模块作为特征信息进一步提取的开关,对不同尺度的特征图收集其相应的特征信息,提高图像语义分割的精度与准度,从而进一步设计出鲁棒性更好的图像语义分割网络。2.针对跳层结构中存在的部分特征信息不能充分使用的问题,提出使用通道注意力机制完成浅层与深层信息的融合。通过将浅层与深层信息在通道维度上堆叠,使用全局平均池化和非线性激活函数Sigmoid等操作,完成深层特征信息对浅层特征信息的指导,最终二者相融合。在跳层结构中,设置一个通道注意力提取的过程,有助于深层与浅层更好地融合的同时,也将像素点之间的关联性进行了学习。3.针对计算机视觉任务中的注意力学习其存在计算量过大的问题,本文提出采用池化的方式替代注意力机制中原有的相关性矩阵的计算,尽可能减少计算复杂度。在通道和位置维度使用平均、最大和随机池化获取不同的特性信息,以较低的计算复杂度有效地提取具有鉴别性的特征信息。本文在ResNet上添加设计的模块构成新的图像语义分割网络。与此同时,针对相应的数据集进行消融实验,并将实验结果与一些先进的网络进行对比实验。通过实验结果的比较,上述所提出的图像语义分割方法具有更高的分割预测精度。
其他文献
在现实生活中,许多优化问题涉及多个优化目标,有两、三个相互冲突目标的优化问题被称为多目标优化问题(MOPs)。具有至少四个冲突目标的MOPs被称为高维多目标优化问题(Ma OPs)。由于其在现实世界中的广泛应用,多目标优化研究已成为热门话题。进化算法具有简单、直观以及基于种群的特性,所以其适用于解决多目标优化问题。现有的大量多目标进化算法(MOEAs)都是依赖于Pareto支配关系进行收敛。但是,
欠驱动系统,是一种泛指独立控制输入空间维数相比于系统自由度少的典型控制系统,它的本质上是属于非线性系统,其特点之一便是输入空间的维数低于它所构造的空间。相比较全驱动系统,欠驱动系统具有结构简单,可以节约能源,成本相对低廉,系统更加灵活等诸多优点。欠驱动系统的特点是结构简单,便于对系统进行整体分析以及仿真实验,便于研究和验证各种算法的有效性。近几十年来,欠驱动系统的控制一直都是控制科学技术领域的热门
伴随着智能电网的兴起,我国已将分布式能源建设放在战略位置。但由于风电、光伏等分布式能源具有间歇性,波动性等特点,如果直接并网会给整个微网系统带来许多难题。而在微网中增设储能系统,不仅能提高供电的可靠性,还可以给用户侧带来直接的经济效益。本文在对风光数据进行预处理的条件下,建立应用于多场景的混合储能综合效益模型和寿命预估模型,根据不同用电地区制定不同控制策略,并引用智能优化算法对综合模型进行求解。围
无线电能传输(Wireless Power Transmission,WPT)作为当代新兴的能量传输方式,具有便捷、安全、可靠的特点,近年来受到人们的广泛关注。线圈作为WPT系统中重要组成部分,其耦合系数直接影响无线电能传输系统传输效率。线圈结构及其物理参数与耦合系数息息相关。因此,开展线圈结构及其参数优化研究,对提升WPT系统传输效率具有重要意义。针对提升线圈间耦合系数的问题,传统方法主要以优化
实际环境光伏发电系统的快速发展可以有效缓解现有能源问题,然而太阳能自身受天气等因素影响,成为不可控能源,外界因素造成的光伏阵列局部阴影会给光伏发电系统造成能量损失。因此寻找到能够有效提高光伏阵列光电转换效率的方法,是保障光伏发电系统稳定运行的重要手段。本文基于现有光伏系统的不足,通过正确诊断出均匀光照和不均匀光照条件,利用策略切换对最大功率点进行追踪搜索,使得光伏阵列能够输出平滑稳定的最大功率值。
学位
目前,大多数人脸识别算法仍然集中在限定条件下采集的单分辨率图像。在实际场景中,因光照条件、有无遮挡物以及成像设备中数字变焦或者光学变焦的功能差异,使得同一个人或场景存在着不同分辨率的多个图像。若将传统人脸识别算法直接应用于实际问题时,算法的分类精度与泛化性能将大幅下降。因此,如何提高多分辨率人脸识别的性能是该领域中亟需解决的问题,具有极大的应用价值与行业需求。本文主要围绕多分辨率人脸识别问题进行深
学位
细支卷烟符合中式卷烟产品创新方面的发展目标,除了能有效降低烟气排放、保护吸烟者周边环境、降低人身健康损害外,还能显著降低烟草成本。研究选用市面上31种细支卷烟进行烟支物理指标和烟气常规成分进行测定,各指标平均值为烟支长度494.34 mm,圆周17.05 mm,吸阻1437.42 Pa,总通风率42.18%,质量0.53 g,频数统计显示不同种细支卷烟在吸阻、总通风率和质量存在较大差异;烟气常规指
学位