基于分解卷积和注意力机制的实时语义分割算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:LIU73558109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割在自动驾驶、医疗影像分析和视觉增强等领域中发挥着重要作用,旨在识别图像中每个像素点的类别,是计算机视觉领域中极具挑战性的像素级分类任务。目前,随着深度学习技术的发展及海量数据的大力支持,图像语义分割发展迅速。在自动驾驶领域,要求图像分割具有较高准确度和较快推理速度,现阶段研究普遍采用复杂的网络结构和大量的卷积层堆叠,导致算法模型时延高及内存占用大,不利于真实场景应用。本文基于卷积神经网络,从模型轻量化角度出发,设计保持较高精度并具有较快推理速度的分割算法,具体研究内容如下:1.在双路径网络结构中,针对上下文路径缺乏丰富的上下文信息及易忽略较为显著的边缘特征,空间路径分割粗糙及推理速度缓慢的问题,提出基于通道交流的双重注意力实时分割算法。该算法首先通过建立空间注意力和通道注意力捕捉空间上下文和通道上下文的依赖关系,获得丰富上下文信息从而细化分割;然后采用深度可分离卷积技术和空洞卷积技术改善模型推理速度,提高局部信息和全局信息提取能力;最后采用元素加法和通道连接方式融合两分支特征,再经双线性插值恢复图像特征,算法在Cityscapes数据集上取得72.8%的精度和推理速度为93.5FPS的较好效果。2.在浅层网络模型空间信息丰富的基础上,提出基于注意力机制和有效分解卷积的实时分割算法。算法首先利用分解卷积和深度可分离卷积技术减少运算量和内存占用,从而提高处理速度,并通过空洞卷积增大感受野,增强捕捉上下文信息的能力;然后结合池化操作和注意力机制构建全局上下文注意力模块以捕捉全局信息,为编码阶段提供更为细化的特征,从而优化分割效果;最后由双线性插值上采样恢复图像尺寸;该算法在Cityscapes数据集上取得74.0%的精度和推理速度为118.9FPS的较好效果。本文通过构建两种网络模型,较好地平衡了准确性和实时性之间的关系,为进一步研究奠定了理论基础。
其他文献
近年来,物联网(Internet of Things,IoT)在智能家居、智慧医疗、生态环境监测、工业生产等领域取得了极大的成功,促进了人们生活生产的智能化。然而,大多物联网设备缺乏安全防护机制,设备安全漏洞百出。这些物联网设备极易被攻击者入侵并控制,以组建大规模的僵尸网络,对物联网发起分布式拒绝服务(Distributed Denial of Service,DDoS)攻击,这给物联网带来了严重
学位
毫米波因其广阔的频谱资源成为了5G的研究重点。受益于其较短的波长,研究人员通过增加天线,引入大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术,结合波束成形来抵抗路径损耗带来的性能丢失。数模混合的波束成形方式因其平衡性能与功耗的特点,成为了毫米波系统波束成形设计的主流方向。其次,全双工(Full-Duplex,FD)通信模式理论上可以达到两倍于半双工(
学位
针对通信拒止复杂环境下的导弹集群多目标分配问题,提出一种分布式的多目标分配与决策方法。基于弹-目攻防性能指标,设计时间戳、获胜导弹、获胜投标、优势度等列表,通过一致性和拍卖阶段,优化目标分配方案,并借鉴自然界鸟群、鱼群等群居性生物的群体协同运动机制,利用“避撞-结队-聚集-攻击”集群行为规则模型(Separation Alignment Cohesion Offense, SACO),结合集群动态
期刊
知识图谱作为推动人工智能从计算智能、感知智能到认知智能发展的核心驱动力,能为教育信息化2.0时代的教育教学提供新的赋能。知识图谱嵌入是将实体和关系映射到连续的低维向量空间中,提高计算效率,增加下游应用的多样性,为下游模型提供语义支持。然而,大多数知识图谱嵌入方法注重实体的结构信息,忽视或者未能充分利用实体的背景信息。在教育场景下,直接使用一般模型训练出的嵌入不够准确,包含的特征信息少。为此,本文充
学位
随着无线物联网和互联网接入需求的不断增长,Wi-Fi技术已经无处不在。除了用于无线通信外,Wi-Fi系统还可以利用信道状态信息(Channel State Information,CSI)进行无源感知。与其他智能传感解决方案相比,Wi-Fi传感具有低成本、非侵入性、隐私保护、不受光线影响等优点。考虑到用户对低成本和低功耗的要求以及Wi-Fi终端有限的计算资源,通常的解决方案是将CSI数据传输到云服
学位
城市道路场景纷繁复杂,传统图像分割算法只能通过图像的颜色、纹理和形状等低级特征,将图像划分成多个具有独特性质的区域,造成分割精度低、速度慢的现象,因此难以满足真实场景中的工业生产需要。随着Alex Net在2012年摘取图像分类竞赛Image Net上的桂冠,计算机视觉领域掀起了使用深度学习技术的浪潮。基于深度学习的实时语义分割算法能够自动提取目标的深层特征和语义信息,为复杂城市道路场景的解析提供
学位
随着移动互联网时代的发展,易于获取的Wi-Fi信号常被用于提供室内定位服务。基于信道状态信息(Channel State Information,CSI)的室内Wi-Fi定位因其部署成本低、定位精度高、环境适应性强等特点而备受关注。然而,CSI的不稳定性会导致对其处理的复杂性显著增加,且无线信号的时变性也将影响定位精度。对此,本文提出了一种基于CSI张量分解的室内Wi-Fi指纹定位方法,其主要内容
学位
基于深度学习的实例分割是图像处理领域的热门分支和极具挑战的任务。实例分割不仅需要具备目标检测定位目标位置和语义分割区分目标类别的能力,还需要分辨出同一类物体的不同个体。目前两阶段实例分割可以达到较好的分割精度,但单阶段实例分割凭借更简单的网络结构,在速度上更胜一筹。基于轮廓点在极坐标上表示掩膜的方法为单阶段实例分割开辟了新的思路,其优点在于简化了实例掩膜的建模过程,同时在训练阶段没有锚框的限制。本
学位
随着集成电路和微波技术取得重要突破,毫米波雷达被广泛应用于多个领域,正逐渐成为物联网发展中的关键性技术。相比传统的非接触式视频传感器,毫米波雷达因具备全天时、低成本及隐私性强等特点成为当下目标检测领域的研究热点。因此,研究毫米波雷达目标检测对于智能安防领域及智慧交通领域等应用具有重要现实意义。但在多目标检测场景下,毫米波雷达仍面临着无法有效区分多个目标以及检测算法性能不佳等问题。本文围绕上述问题开
学位
随着数字化技术的发展,计算机辅助诊疗系统已经大量应用于口腔医学领域。三维牙齿模型分割是计算机辅助诊疗系统的关键步骤,其分割结果可以为临床诊断提供重要的参考信息。现有的三维牙齿模型分割方法通常利用深度学习技术进行全自动的牙齿分割,相比于传统分割方法具有更好的鲁棒性和泛化性。然而,由于临床环境中患者牙齿结构的复杂性,三维牙齿模型通常存在牙齿错位、缺牙等情况,这使得现有方法的分割性能仍然面临巨大挑战。在
学位