面向纹理分类的深度神经网络设计与优化

来源 :浙江大学 | 被引量 : 0次 | 上传用户:dusan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学技术的飞速发展与相机设备的广泛普及,计算机视觉技术取得了长足的发展。在计算机视觉技术中,纹理特征作为图像识别、语义分割与场景理解等视觉任务的基础,在人脸识别、表面材质检测、工业检测、医学图像分析与遥感图像分析等领域得到了广泛应用。现有的纹理特征分类方法在识别精度与计算复杂度存在一些问题,并不适用计算资源受限的边缘计算平台。因此,为了提高纹理分类任务的性能表现,同时降低纹理分类模型的计算复杂度,本论文设计了基于深度神经网络的纹理分类方法,并通过结合网络剪枝与权重二值量化的压缩方法以及二值神经网络两种途径,实现深度神经网络的模型压缩与推理加速。网络设计方面,设计了面向纹理分类的局部纹理特征提取算子、局部纹理特征提取模块与深度神经网络。特别的,该局部纹理特征提取算子通过计算相邻像素间的像素差值并进行自适应的加权,从而提取输入图像中蕴含的纹理特征。此外,纹理网络设计时,采用纹理特征编码、双线性模型与迁移学习策略,从而实现高精度的纹理图像分类与端到端的训练。网络压缩方面,设计了结合网络剪枝与权重二值量化的压缩方法,该压缩方法包括基于通道L1范数的双向重要性评估方法、针对ResNet的通道匹配算法、剪枝保护策略与针对二值量化过程的正则约束方法。同时,本论文设计了针对权重二值量化的热身策略,该热身策略在训练的过程中逐步增加正则约束项的系数,驱使卷积核权重远离零点从而减少权重二值量化过程中的性能抖动,加快二值权重网络的收敛速度与性能表现。二值神经网络方面,设计了二值神经网络的局部激活方法、局部激活算子与局部激活网络结构。特别的,与传统的直接二值量化不同,该局部激活方法通过比较相邻像素点的数值差异从而判断局部激活值的大小,进而提取输入特征图内部的二值化纹理特征。此外,后向传播过程,本论文提出了一种基于分段渐进正弦近似函数的梯度近似方法从而减少梯度失配并实现更高精度的纹理任务分类。在总结全文工作后,本文对高精度的纹理分类任务、高压缩率的网络压缩技术与高精度的二值神经网络进行了展望。
其他文献
随着第五代移动网络(The 5th Generation,5G)的商业部署,以人工智能、云计算、物联网为代表的新兴行业不断涌现,各种便携式无线通信设备的数量出现了爆炸性的增长,这对5G网络容量的可持续发展提出了极大的挑战。为了尽可能地节省无线通信设备的能耗和成本,同时满足高速率大带宽的系统需求,智能反射面(Intelligent Reflecting Surface,IRS)辅助的毫米波通信技术以
学位
近年来,个人媒介以及互联网技术的发展产生了海量的数据资源,为机器学习的飞速发展提供了绝佳的土壤,但随之而来的海量数据的标注问题也面临着巨大的挑战。另外,在某些实际应用中,单个的正向标签往往更容易被获得或引起人们的关注。因此,对仅有部分正例数据(被标注为正例的样本)与无标注数据的场景展开研究,充分挖掘隐藏在这些数据中的潜在信息,开发有效的正例无标注学习算法具有重要的理论意义。但现有的正例无标注学习大
学位
<正>如果我带着很多星星走到彩虹桥上,把星星挂在美丽的夜空,那么天上不就多了千万个闪闪发光的星星吗?如果我把许多美味的巧克力糖带到彩虹桥上,再把这些糖撒下来,那不就是在下巧克力雨吗?如果我带着滑板车从彩虹桥的这头滑到那头,那该有多刺激啊!
期刊
《义务教育数学课程标准(2022年版)》于2022年4月正式发布,对比于2011年版课标,《2022版课标》将“立德树人”作为整个课标编写的目标与宗旨,强调数学核心素养的培养,调整并优化了相关课程内容.本文以初中数学教师的视角,简要阐述基于核心素养对《2022版课标》调整与优化部分的理解以及如何落实在教学一线的思考.
期刊
综合管廊是地下空间浅层开发的市政基础设施,是指把原先直埋的管线(供水、排水、燃气、热力、电力、通信、广播电视、工业等)都入廊集束起来。目前已运行的综合管廊,暴露出许多安全隐患。汇总了综合管廊监控与报警系统案例,剖析了问题并提出相应整改建议。
期刊
生物种苗作为水产产业链的源头,亦是水产行业之根基所在,其好坏直接关系到养殖成败,决定着未来产业的命脉。种苗被称为水产业中的“芯片”,中国种业不仅要克服自然环境的挑战,也要减少对外进口的依赖。面对水产种质资源安全性的严峻挑战,许多科研院所开始对苗种培育和种苗优选进行攻关。水产生物的表型数据是育种优选过程中重要的参考因素,但目前国内缺少相应的智能装备。论文以沼虾表型数据测定的深度学习压缩模型为研究目标
学位
LED屏能够显示图形和汉字,应用于列车广播系统给人们日常生活带来更多方便,LED点阵显示屏较为多见。文章对重庆六号线列车广播系统车侧LED屏坏点检测进行研究,以提高故障检测效率,并提供对应的维修措施,以提高列车广播系统服务质量。
期刊
废用性肌萎缩是一种常见临床并发症,其具体表现为肌肉体积萎缩、肌肉失活、肌肉力量下降等。常见的预防与治疗废用性肌萎缩的手段包括运动疗法与物理疗法。运动疗法中最常见的仪器为持续被动运动(CPM)康复器,它能够促进骨关节软骨再生和修复,但由于肢体缺乏主动运动,肌肉活性提高的程度是有限的。电刺激疗法是目前最流行的物理疗法,它能够强化患侧肌肉收缩来预防和治疗废用性肌萎缩,但是却存在易疲劳、参数选择依赖治疗师
学位
图像作为最容易被人类所认知和接受的信息载体之一,在日常生活和科学研究中的地位愈发重要。在图像质量评价(Image Quality Assessment,IQA)领域中,我们需要设计一种能够对失真图像的质量分数做出客观评价的算法,最终得到的评价结果与人眼实际观测结果一致。其中无参考(No Reference,NR)IQA可以直接输出失真图像的质量分数,不需要其他任何参考信息,具有非常重要的研究意义和
学位
学位