基于显著性多模态小样本学习方法之研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zm4910588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络的提出,深度学习在图像分类,语音识别和物体检测等任务中取得了惊人的成绩。然而,这些研究通常都需要大量带有标签的数据进行训练,但在现实生活中,想要获取到大量的数据是十分困难的,限制了模型在现实世界中的适用性。而人类能够通过一张或几张图像学习到一个新的物体,通过之前学习到的知识,来帮助快速学习新的内容,小样本学习随之产生。现有的小样本学习主要从单模态在元学习,度量学习等方面进行研究。人类可以从多个信息源获取信息帮助学习,同时在观察一张图像时能够快速定位到具有辨别力的区域。如何从图像中快速获得重要信息,也是计算机视觉领域的关键问题。基于以上问题,结合图像的多模态信息获取,本文提出了一种基于显著性的多模态小样本学习方法。从人类视觉注意力角度入手,本文采用了显著性目标检测网络对图像进行处理,分离图像的前景、背景区域,更关注于图像前景部分,继而关注图像背景,符合人的视觉认知需求。通过视觉信息与语义信息的多模态结合,丰富图像的特征表示。语义信息提供的先验知识和图像背景的补充对图像识别都有所帮助。最后,本文在四个数据集上验证了模型的有效性。
其他文献
卷积神经网络对图片各种形变所具有的适应性展现了该网络在图像处理方面的较大优势,因此在近几年人工智能的应用中颇受青睐。由于网络本身具有较大的计算量,因此在嵌入式端的应用被能耗及算力所限制。FPGA具有丰富的计算资源可以灵活调配的同时还具有功耗低的特点,适合做卷积神经网络的移植应用,但开发过程没有组件可以调用,使得开发需要从头开始,难度较大,因此解决这个问题变得极具价值。本文从卷积神经网络的基本结构入
学位
随着定位技术的不断发展,人们日常生活的方方面面都得到了极大的便利性的提升。全球定位系统(GPS)以及我国的北斗卫星导航系统都可以提供较高精度的定位位置,因此人们日常生活对定位信息的依赖性越来越强。现实生活的场景诉求使得室内定位技术研究依然重要,与此同时对室内定位技术提出了高精度要求。在众多的室内定位技术中,Wi Fi定位技术由于设备易搭建、成本低,使得其获得更多的关注。在通过基于接收信号强度的方法
学位
情感识别最终目的是让计算机能够识别人类的情感,从而使得计算机更具人性化。基于生理信号的情感识别,主要的研究对象是人体的生物电反应。传统的情感识别大多是从表情中得出结论,但非接触数据的可靠性和客观性较低。生理信号的变化状况是人类情感最重要且最真实的表现之一,受人类意识的影响较小,可信度有所保障。在以生理信号为对象的情感识别中,研究的关键是怎样有效提取不同情感状态的特征。本文使用的生理信号数据来自于实
学位
报纸
网络担保贷款是亚洲国家独有的一种经济现象,所谓的网络担保贷款就是当企业集团从商业银行获得贷款时可以相互担保,从而形成复杂的担保网络。在经济放缓期间,企业违约可能像病毒一样传播,并导致大规模违约甚至系统性金融危机。近年来在国内,对于担保网络中的违约传播所造成的影响时有发生,民企的“抱团取暖”瞬间变为“火烧连营”,这些金融现象的产生引起了金融监管机构和政府的关注。监管和分析担保网络中违约风险的传播路径
学位
文本可视化是数据可视化的一个重要领域。可视化方案通常有两种形式。一种是复杂视图,供专业人士使用,以显示文本信息的全部细节;另一种是讲故事视图,供非专业人士使用,只显示事件的重要信息。其中,讲故事视图因其通俗易懂、受众广泛等特点一直是学者研究的热点。如何在短时间内讲好一个故事是当前研究的热点之一。我们设计了一个交互式讲故事的可视化系统,分析社会化短文本,比如twitter数据,使用动态主题模型(DT
学位
<正>路遥的《平凡的世界》和《人生》都以温情的笔调和动人心弦的“心里话”描写了一代人的生活中的酸甜苦辣。作者以娓娓道来的笔调,用带有黄土般醇厚的语言,刻画了一群在广袤无垠的黄土地上扎根农村,一心过好家中光景的形形色色的“后生女子”。不管是《平凡的世界》还是《人生》,小说中的主人公都带有作者对于这个时代特定人物的观察,并以自己的方式给予了他们殷切的希望。本文主要通过两部小说的性格、思想相似的主要人物
期刊
点云是一类由深度相机、三维激光扫描仪等设备获取的海量点的数据集合,它可以完整地保存模型的几何信息,不需要任何离散化处理,而且表示也十分简单。由于使用方便,它被越来越多地应用到了三维重建、逆向工程、无人驾驶等领域。但是在数据采集过程中,常常会因为物体的遮挡、设备的噪音等因素影响,导致生成的点云稀疏且不均匀,使用这样的点云来进行三维重建、逆向工程等任务是困难的,因为缺少点,无法捕捉到局部的空间几何信息
学位
从可视化出发反向探索原始数据的过程称为可视化沿袭。在大规模数据集上实现数据索引结构是目前实现实时交互探索的主要方式,主要存在查询时间和存储空间两个问题。现有的技术往往通过对原始数据的简化处理以实现低存储开销,这种方式导致了真实数据的丢失。可视化沿袭可解决这一问题。可视化沿袭对数据的精度要求更高,因此会约束原始数据的简化,进而增加存储成本。实现大规模数据集上的的可视化沿袭与交互探索是一项挑战,主要体
学位
随着互联网的飞速发展,电商平台逐渐兴起,越来越多的人选择用电商平台购物。人们在消费前往往会关注已买消费者对产品做出的评价,关注产品质量是否过关并判断产品是否符合自身需求,商家也会根据客户评论及时提升产品质量,调整商品供货满足更多消费者需求,评论数据的情感分析应用而生。随着产品复杂度提升,一段用户评价中可能包含对该产品多个方面的评价,单纯对整句话做情感分析并不能够代表每个属性,而基于不同实体属性的情
学位