基于Transformer的图像特征提取方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:woai894781693
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像特征提取是当前计算机视觉领域的重要技术之一,很大程度上决定着许多视觉任务的精度与速度。随着大数据时代的发展,海量的图像数据与各种复杂的实际应用场景使得高效而精准地从图像中提取特征成为了挑战,学术界因此对图像特征提取方法进行了广泛的研究。近年来,基于Transformer提取图像特征的方法被广泛研究,但相关模型仍存在一些需要改进的地方。首先,Transformer的复杂度与输入的序列数量成二次关系,阻碍了基于Transformer设计的图像特征提取网络对高分辨率的图像建模,并且高昂的计算成本使其很难适用于边缘设备。其次,Transformer在建模视觉结构时缺乏归纳偏置,使其需要采用超大数据集进行预训练。最后,与卷积神经网络相比,Transformer模型可优化性较差,对于优化器的选择较为敏感,缺乏稳定性,收敛速度较慢。针对上述问题,本文主要工作如下:(1)提出了两种加速Transformer模型的方法,分别从模型内部和外部两个角度去解决当前Transformer模型计算成本高,模型的复杂度与输入的Token数量成二次关系的问题。首先是将自注意力机制本身的二次复杂度降低为线性,从内部提高模型的处理速度;然后又提出了一个无参数,可以根据不同输入图片自适应采样从而筛掉不重要Token的轻量化剪枝方法,从外部减少无意义的输入。最后将两种方法合并得到了一种新的高效注意力机制(E-Attention)。实验表明,两种方法各自可降低原Transformer模型30%-50%的计算量,而E-Attention可以减少原Transformer模型60%-70%的计算量。(2)在本文提出的E-Attention基础上,进一步结合深度卷积和空洞卷积,从平移不变性,局部性,尺度不变性三个角度引入Transformer模型缺乏的归纳偏置。然后再利用一个轻量化卷积模块改变传统Transformer模型对输入图片的处理方式,从而加快收敛速度,提升稳定性。最终得到了一个结合卷积的高效Transformer图像特征提取网络(CEFormer)。实验表明,CEFormer在性能和运算速度之间均取得了良好的结果。
其他文献
初中生思想活跃,对体验性作业有特殊探索兴趣,教师针对学生学习需要做对应设计,推出更多适合的作业任务,调动学生多种感官参与训练活动,其形塑作用更为有效。观察、实验、调查、游戏、讨论、竞赛、电子作业,都带有体验属性,教师要做好优化设计,让学生在作业训练和实践探索中建立学科能力。
生产线数字孪生场景模型数量庞大,逻辑关系复杂,运动模型状态多,动态信息量大。现有的单机渲染方案难以满足逻辑计算与渲染输出的实时性要求。针对以上问题,提出一种逻辑计算与实时渲染并行处理的分布式渲染方法。将场景数据分为逻辑数据和实时渲染数据,逻辑数据分布在控制端,渲染数据分布在渲染端,实现了多机并行渲染。同时,以实现渲染端的动态模型渲染的同步为切入点,设计了GPU多线程机制,实现了逻辑数据与运动实体同
目的:以危险因素为基础构建经剖宫产分娩产后出血风险的临床预测模型,对模型进行验证,对目前剖宫产产后出血临床预测模型存在的问题进行一定的补充,进一步优化剖宫产产后出血临床预测模型研究并提供理论依据。方法:本研究为回顾性研究,以2016年01月01日至2020年12月31日于我院住院,经剖宫产分娩的7645例产妇为研究对象,提取研究对象病例资料,包括年龄、生育史、分娩孕龄、孕期硫酸镁使用史、妊娠合并症
城市发展面临着诸多安全挑战,韧性城市已经成为当下抵御和适应城市灾害风险的研究和实践热点。基于文献计量分析方法,使用Cite Space和VOSviewer可视化工具,分别对1991—2022年中英文文献的韧性城市研究进行知识图谱分析。结果表明:(1)中英文发文量都呈现早期增长缓慢、后期爆发式增长的趋势,目前仍处于增长过程中。(2)中文研究机构合作分散,英文研究机构合作更为紧密,国内机构与国外机构的
<正>初中道德与法治学科作为贯彻和落实党的教育方针和教育思想的重要承载,在立德树人中发挥着关键作用,对于培养学生社会参与层面“责任担当、实践创新”的素养,也发挥着直接的作用。笔者以九年级上册第六课第二课时《共筑生命家园》的教学与作业设计为例,分析研究如何立足课堂培养学生的社会参与能力。一、以“社会参与”为导向的教学设计
期刊
“双碳”目标下我国能源结构正加速转型升级,以太阳能、风能、地热能等为代表的新能源正逐步替代传统煤、油、气等化石能源。推动煤炭和新能源优化组合是实现“双碳”目标提出的新要求,也是未来煤矿绿色低碳转型的重要路径。分析我国赋煤区能源分布特点,发现以煤为主的化石能源分布区域,往往也是太阳能、风能、热能等新能源富集区,适宜于在赋煤区大规模开发新能源。研究结果如下:① 提出了赋煤区全生周期能源开发理念,将赋煤
国家标准GB/T 41670-2022《安全与韧性社区韧性突发事件弱势群体救援指南》用以指导突发事件中城市社区弱势群体所需要提供的应急救援支持。该标准通过分析社区人口结构特点和具体信息,深入调研社区弱势群体,了解不同类别弱势群体的应急救援支持需求,评估不同类型的沟通对社区弱势群体的影响,进而分析突发事件中不同弱势群体的脆弱性,研究社区如何为弱势群体提供应急生理支持、心理支持、灾害庇护、灾后重建等支
冬奥会服装是国家精神文明在意识形态领域传播的视觉载体,冬奥服装设计更是北京冬奥形象景观的重要组成部分。冬奥会服装是赛场上流动的风景线,冬奥服装设计再一次接受了世界人民的检阅。文化如水,浸润无声。传统文化元素的合理运用,不仅能够提升服装美感,而且还能展现传统文化的魅力,对于服装设计具有重要意义。
为了研究分析攀岩特色小镇建设促进乡村振兴的作用,以广西马山县为例实证研究该县因地制宜建设攀岩特色小镇的建设状况。调查显示,攀岩特色小镇建设有着发展当地攀岩旅游产业,促进农村基础设施建设,提高农民收入水平的作用。广西马山县攀岩特色小镇建设存在旅游产业配套设施规划不到位,相关产业人才引进和培育困难,融资力度不高等问题。需要当地政府、行政村(社区)、产业公司和农户相互支持和发展,通过提升村(社区)“两委