轻量级卷积核设计及其在神经架构搜索算法的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qyjby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络的运行通常需要大量的存储与计算资源,这些限制条件使它们很难部署移动端或嵌入式设备中。因此需要通过神经网络模型压缩、轻量级卷积核设计与神经架构搜索等方式来降低神经网络的参数量与计算量。网络模型压缩是一个工作量大且困难的工作。神经网络架构搜索是在由各种卷积核构成的搜索空间中进行自动的网络架构搜索,输出较优的轻量级网络架构。因此,轻量级卷积核的设计是一项至关重要的工作。本文主要研究轻量级卷积核设计与基于该卷积核的神经网络架构搜索这两个关键任务。针对组卷积不同组的卷积核之间信息交流不畅,异构卷积跨通道信息融合连续性被破坏这两个问题,本文提出了新型的轻量级卷积核Dual Conv(Dual Convolutional Kernels,Dual Conv)设计。Dual Conv融合3×3和1×1卷积核并行处理相同的输入特征映射图通道并利用组卷积技术来高效排列各个卷积核,能够有效解决组卷积信息交流不畅和异构卷积破坏通道融合连续性这两个问题。本文将Dual Conv应用至标准和轻量级神经网络架构中,并在图像分类和目标检测多个数据集中进行测试。实验结果表明,Dual Conv在保持深度神经网络准确度的同时能够显著减少网络的参数量和计算量,在一些场景中甚至能够取得比原模型更高的准确率,证明Dual Conv具有很好的泛化能力。本文将Dual Conv应用在神经架构搜索(Neural Architecture Search,NAS)算法中,能够搜索出比原始搜索空间准确度更高的神经网络架构。本文针对现有神经架构搜索空间引入了过多的人为设计,而已有的神经架构搜索空间优化算法效率低这两个问题,设计了一种基于批归一化的搜索空间缩减(Batch Norm-based Search Space Shrinking,BBS)算法。BBS算法以极小的计算代价对搜索空间进行缩减,能够有效减少神经架构搜索算法的搜索耗时。在缩减后的子搜索空间中得到的神经网络架构比原搜索空间搜索得到的架构具有更高的准确度,说明BBS算法对神经架构搜索空间起到了正则化的作用。本文提出的新型轻量级卷积核Dual Conv,能够应用到现有的神经网络架构中,在保持神经网络准确度的同时能够显著降低网络的参数量与计算量,从而使神经网络在移动端或嵌入式设备中的部署成为可能。本文提出的基于批归一化的搜索空间缩减算法,能够应用至现有的神经架构搜索算法的搜索空间中,在显著降低神经架构搜索算法的耗时的同时具有一定的搜索空间正则化的作用。
其他文献
如今,社交媒体在人们的日常生活中占据了越来越重要的位置。每天都有数以百万计的人在社交媒体上发布图片和文字来表达他们的感受和观点,尤其是在Twitter和微博等短文本社交媒体上。由于数据量巨大,人们需要一种工具来自动组织、总结并帮助人们理解这些海量信息。主题模型便是一种自动揭示文本数据中蕴含的主题的统计模型。近来,人们在社交媒体上发布文字的同时,经常会配上图片。由于图片可以为文本提供重要的补充信息来
学位
在当今社会,网络与人们生活之间的关系日渐紧密,身份认证技术越来越受到人们的重视。而口令是一种重要的身份认证技术,因其易于部署、几乎没有额外开销、轻量级等特点,得到了广泛的应用,因此口令安全成为了研究热点。口令恢复是口令安全的一个研究方向,而口令猜测方法是其重要组成部分。目前主流的口令猜测方法会先以真实口令集为训练集进行学习,然后根据学习到的规律构造猜测口令集用于口令恢复,猜测口令集中口令的次序依赖
学位
螺环氧化吲哚是有机合成中的一类重要结构单元,是构成诸多药物、天然产物及其他生物活性分子的基本结构,开发更加高效、绿色、简便的新型合成策略是手性螺环氧化吲哚类化合物研究的重要方向。基于BINOL骨架衍生的手性磷酸及手性磷酰亚胺酸类催化剂催化的不对称反应,一直以来都是有机小分子催化领域的重要组成部分。通过改变3,3’位置的取代基可以起到调节催化剂酸性以及手性空腔体积大小的作用,便于以更适合的方式实现对
学位
含氮杂环化合物在天然产物中普遍存在且在医药、农药等领域有广泛的应用。此外,三氟甲基具有亲脂性、生物相容性和代谢稳定性等生物活性,在药物化学中有着至关重要的作用。调查发现,含三氟甲基氮杂环是许多药物分子的核心结构单元。因此发展快速高效地合成含三氟甲基氮杂环化合物的方法具有十分重要的意义。相比于其它合成含氮杂环化合物的方法,自由基串联环化反应具有高原子经济性和步骤经济性的优点。本论文运用铜催化N-氰胺
学位
茂金属催化剂因其具有极高的烯烃聚合反应催化活性而在工业领域中受到了广泛关注。其中,具有桥连结构和特定对称性的茂金属催化剂表现出显著的催化丙烯立体可控聚合的活性,有着巨大的工业化和商品化的潜力。目前,多数的茂金属催化剂合成效率低,品质不稳定,生产成本居高不下,这些缺点严重制约了茂金属催化剂的工业化发展。为此,本论文针对一种具有二甲基硅桥连和噻吩并环的C2对称茂锆催化剂6,6’-二甲基硅基双(2,5-
学位
超分子化学作为一门新兴的交叉科学通过非共价相互作用将具有不同结构和功能的单元相结合来构筑动态可逆的智能复合材料,为分子机器、材料化学和生命科学的发展开辟了新的前进方向。超分子化学的蓬勃发展离不开设计合成结构新颖、性能优异的大环受体分子,柱芳烃作为一种新型的大环主体化合物,基于其富电子的刚性空腔、对称的骨架结构和优异的主客体性质构建的超分子复合体系已经广泛用于传感检测、反应催化、药物运载和智能响应等
学位
文本口令是目前应用最广泛的身份认证方式之一。随着人们安全意识的提高,长口令越来越受用户和系统管理员欢迎。口令猜测算法能有效识别弱口令,指导用户构造更安全的口令。然而目前国内外对长口令猜测算法的研究较少。因此对长口令猜测算法的研究是具有现实意义的。目前已泄露的真实口令集中,长口令的占比较低(Rockyou口令集中长度不小于12的口令占5.5%)。这约束了传统数据驱动猜测算法对长口令的猜测效率。由于可
学位
超低湿度(<250 ppm)的监测在一些重要的工业生产中发挥着极为关键的作用。对于超低湿度的检测,目前主要依靠于传统的电子传感器,但其价格十分昂贵,且使用过程中需要额外的外部电源驱动以及复杂的信号接收系统,携带不太方便,致使应用场所受限。相比之下,基于颜色可视化的比色湿度传感材料有着巨大的优势与潜力。然而,现已报道的可视化湿度检测材料/体系的检测范围绝大多数都在2500 ppm(10%RH)以上。
学位
无监督预训练学习致力于通过设计可适用于大规模数据学习的前置任务,从而帮助神经网络从海量未标注的数据中得到通用的表征。近年来,在计算机视觉和自然语言处理中,无监督预训练模型都取了巨大的成功。在计算机视觉中,无监督预训练模型作为一种通用的网络表征,它对下游任务中图像分类、检索、目标检测、图像分割都有着关键性的影响。大量工作表明,预训练模型的好坏往往决定着下游任务的收敛速度与准确度。对于计算机视觉的任务
学位
在现实社会中,很多场景可以用图结构表示,如论文引用网络,社交网络等。图上的社区发现是图结构分析的重要内容,并有着重要的现实意义。例如,在社交网络中,同一社区的用户之间喜好较为相近,因此能够帮助商家进行更精确的广告推送。与图上的其他问题,如节点分类、链路预测问题不同,社区发现通常需要使用无监督的方法来解决,即在训练过程中不能使用任何数据标签,因此是非常有挑战性的问题。同时,在现实场景中,图结构不会一
学位