基于注意力机制的生产图像自动标注

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:zhanghongyingyxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能制造技术的蓬勃发展,工厂内的车间设备逐渐智能化,生产图像的质量也越来越高。如何使用大量的图像视频数据结合人工智能技术对工厂实现精细化和智能化的管理是一项亟待发展的任务,其中对工厂车间状态的检测分析为至关重要的一环。结合图像语义分析技术与智能制造技术能实现车间对生产过程智能监测。本文主要围绕如何将图像自动标注技术应用到智能制造领域展开研究,其中重点关注视觉注意力机制的设计和标注句子属性分析两方面的内容,主要工作概括如下:(1)针对生产过程中的车间图像背景噪声大问题,利用目标检测模型对图像前景特征的提取能力,提出了基于自顶向下注意力机制的图像自动标注模型(Visual-Semantic Attention,VSA)。VSA模型在基础框架上设计了视觉注意力机制,首先使用基于YOLOv3模型的目标检测网络提取图像中的前景视觉特征并编码,再使用基于双层长短时记忆网络的语言模型生成最终的生产图像标注。同时在网络的训练过程中使用了迁移学习算法训练参数,在不降低模型准确率的同时,提高了模型的训练效率。为了更好的验证模型在实际生产过程中的性能,搭建了基于工业生产实情的工业数据集-XRindustry。在MSCOCO数据集和XRindustry数据集上的实验结果验证了视觉注意力模块能有效提高模型的性能,使模型更加适用于智能制造领域。(2)针对传统语言模型生成的单词与图像视觉特征关联性低的问题,利用了自然语言处理中的注意力机制,提出了基于属性分析的图像自动标注模型(Semantic Attention,SEA)。为使生成的标注句子中包含更多的图像信息,SEA模型首先使用指针网络和视觉权重对每个单词的视觉特性与语义特性进行分析,再生成完整的标注句子。模型在MSCOCO和XRindustry数据集上的对比实验结果验证了属性分析模块的设计能有效的提高生产描述与图像特征的关联性,同时验证了在语言模型中加入基于视觉模型的注意力机制能有效的提高生成句子的连贯性和语序正确率。
其他文献
随着多智能体控制技术在军事、工业和农业等领域中的广泛应用,人们对多智能体的研究也逐渐深入。由于科学技术的发展和人类各方面需求的不断提高,人们对设备运行的效率和精度要求也越来越高。像本文研究的多智能体系统这样复杂的系统,其结构也变得越来越庞大、复杂,所涉及的执行器、传感器及系统部件也越来越多、分布空间越来越广。由于系统长时间运行和外界环境干扰等因素,这些部件在运行过程中难免会发生故障。万一发生故障,
浮雕作为一种广为流传的雕塑艺术表现形式,多个世纪以来广泛应用在钱币、建筑和工艺品等多个领域。传统浮雕种类繁多,根据雕刻内容的不同,常见的浮雕包括人物、花纹、动植物等等,按照压缩程度的不同,主要分为高浮雕和浅浮雕。本文主要研究人脸肖像浅浮雕,传统的肖像浮雕建模很大程度依赖于手工艺人的经验并且非常耗时。随着计算机科学的发展,在浮雕建模领域各种各样的自动生成浮雕的方法不断涌现,但目前大部分浮雕建模主要围
纵观世界城市交通轨道发展,我们发现越是城市经济发展水平较高的国家,其城市轨道交通网络越为完善,政府也更是鼓励社会资本的积极投入其中。本文站在社会资本角度,通过全面风险管理对T城市轨道交通PPP项目投融资风险管理进行研究,有利于提升城市轨道交通项目的运营效率,激活社会资金的融资机制,从根本上规避轨道建设中存在的风险,具有较好的指导意义。本论文以T城市轨道交通PPP项目投融资风险管理为研究方向,基于相
电力系统逐步发展稳定,智能电网日渐完善,用户用电信息采集系统广泛应用。而随着用户用电信息采集系统的应用积累了大量的用户历史用电数据。这些数据为为电力部门电网规划、
近年来,万物互联,网络发展迅速,无纸化的不断普及,促使了大众交流方式的改变,不再只是面对面一种方式,人们越来越热衷于通过发表评论来表达自己的观点和看法,数据量日益递增。同时海量的数据也导致了无效信息的不断积累,有效信息难以直观体现的问题,对这些海量评论中蕴含的主观有效信息进行深入的挖掘,抽取其中有价值的信息,能够帮助各行各业把握舆论态势,引导商品未来发展走向,也能够为用户本身提供所需关键信息,做出
随着社会经济水平的快速发展以及网络技术的提升,让人们对于生活环境和生活方式的智能化要求有了进一步的提升,促进了共享经济的发展。同时,在工业生产中工厂对于智能化制造的需求也日益提高。因此,生活环境和生活方式的智能化控制和工业生产中的智能化制造具有很重要的现实意义和广阔的发展前景。物联网技术的发展满足人们和工厂的这方面需求。但是也是随着物联网技术的发展,隐私问题逐渐成为妨碍物联网技术应用的一个关键问题
近年来,由于现代科学技术的蓬勃发展,控制科学,人工智能,计算机技术等学科的进一步交流融合,多智能体系统分布式协调控制对工业生产,交通运输,航天航空等行业都产生了相当广泛的影响,因而引起了国内外学者的关注与研究,编队控制问题就是多智能体系统分布式协调控制中的一个热点问题。本文重点讨论了基于相对距离和角度信息的非完整系统编队控制问题。针对具有未知扰动的非完整小车系统,提出基于负梯度算法的自适应摄动三角
类胡萝卜素是广泛存在于自然界中的一种类异戊二烯物质,具有重要的生物学功能,作为食品着色剂的同时具有抗氧化、抗癌、降低白内障等药用价值。掷孢酵母(Sporidiobolus pararoseus)类胡萝卜素合成途径包括黄色支路(β-胡萝卜素)和红色支路(圆酵母素和红酵母红素)两种。其中红色支路中圆酵母素和红酵母红素属于真菌特有类胡萝卜素,具有极性强、颜色鲜艳等特点,并且其抗氧化能力优于黄色支路中β-
新课标明确指出,学科教育应该关注学生的主体地位,促进学生的全面发展。新课程改革的任务之一是转变学生的学习方式,探究式教学模式正是新课标改革的产物。在数学学科内容中选择适合探究的部分进行探究式教学,可以激发学生的开放性思维,从而培养学生发现问题、提出问题、分析问题、解决问题的能力。为了更好地展开高中数学立体几何知识的教学,本文将探究式教学与立体几何课堂融合在一起,尝试以心理学理论为依据,以高中数学立
有序介孔金属氧化物因其高比表面积,丰富的孔道结构,和自支撑的结构特点广泛应用于医药,传感,催化等领域。本论文中设计合成了一系列具有高比表面积、可调骨架尺寸与化学组成的有序大介孔铈基,钨基金属氧化物,并对其进行性能测试。研究了材料的介观结构参数(比表面积、孔径分布、孔壁厚度以及孔容)和骨架化学组成对Cr(VI)吸附和气敏性能的影响。采用一系列不同结构的介孔氧化硅KIT-6为模板、六水合硝酸铈作为前驱