基于深度学习的多视图三维目标分类方法研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:oibaggio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维目标分类是计算机视觉领域中一个重要的研究课题,良好的分类性能可以为后续的高级处理提供支持。传统分类方法通过人工提取数据特征,不足之处是人工设定费时费力且依赖主观经验,而深度学习模型能够自动学习数据的深层特征,减少了人工分类的主观性,准确率相对较高。多视图表示是三维模型的重要表示之一,符合人眼对目标的视觉感知,可以作为深度学习模型的输入数据。本文针对基于深度学习的多视图三维目标分类问题,研究了三维模型的多视图表示及选择方法,并采用深度学习模型对三维目标进行分类,旨在提高准确率的同时进一步提高计算速度。本文的主要工作如下:(1)针对多视点视图数据缺少视图间的关联信息问题,本文提出了三维模型的多视点与全景视图表示方法。本文首先构建了三维模型的多视点视图数据,在此基础上进一步构建了全景视图数据,增加了视图间的关联信息,并把两者结合起来,形成完整的多视图数据集,以获得模型的完整信息,解决多视点视图的信息缺失问题,实验表明该模型表示方法的有效性。(2)针对多视图数据样本较多且存在大量冗余模糊特征的问题,本文基于构建的多视图数据集提出了多视图显著性分析与选择算法。本文首先通过梯度计算来分析多视图的显著性,根据梯度对视图进行排序,在此基础上选择特征显著的视图,解决计算效率不高的问题,在公共数据集上的实验结果表明多视图分析与选择算法的有效性。(3)针对多视图中的单个视图特征信息较少、特征描述不充分的问题,本文在多视图数据构建、分析和选择的基础上提出了基于聚合特征描述的多视图分类模型。本文首先对多视图进行池化,把多个视图的特征信息聚合起来,生成代表该三维模型的聚合描述子,在此基础上基于VGG-M模型实现对多视图的分类,在公共数据集上的实验结果表明基于聚合特征描述的分类模型具有较好的分类效果。
其他文献
以"甬优1号"葡萄果实为原料,探讨贮藏温度(273.15、283.15、293.15K)对果肉和果皮总酚、花色苷和抗氧化活性的影响,并应用Gomportz函数模型,对不同温度下葡萄果实贮藏期间抗
<正> 一、引言从近几年的工作看来,无论是气候学区划、动物学区划、植被区划、土壤学区划、地形学区划等,河南省在我国自然区划的位置是处于亚热带向暖温带的过渡地带,已是无
“老鼠娶亲”是民间年画中用于辟邪祝福的题材,以湖南滩头年画“老鼠娶亲”作为佐证,绕过年画本身和鼠婚的传说,去探寻隐于其后的民间俗信.
固原市原州区位于宁夏南部,水资源量少质差,其天然禀赋条件不能满足日益增长的社会经济发展对水资源的需求,故需对水资源进行合理高效配置,打破水资源瓶颈制约。通过建立HEC-ResSi
近年来,随着信息时代的快速发展,传统媒体视野下的融媒体发展模式越来越广泛。融媒体的发展,给传统媒体的发展带来了新的发展活力、新的发展思维、新的发展模式,极大地推动了
文章基于作者正在进行教学中的本科一年级建筑设计课程教案设计、教学实践背后的思考而展开讨论,指出建筑学基础入门教案设计背后的三点前提思考:结合理论知识和技能的训练内
现已发现基因突变型78种,中国人有12种。G6PD205赖氨酸是维持酶活性所必需;第386-387位赖氨酸-精氨酸及经38-44位氨基酸分别为第一及第二NADP+结合点。每个G6PD亚基由个结构域组成,小的结构域是一个典型的与二核苷
目的探讨不同饮食结构对茶碱在大鼠体内的药动学影响。方法 36只大鼠分为对照组(空腹给药)、标准饮食组(给药前给予标准饮食)和高脂饮食组(给药前给予高脂饮食),各组大鼠灌胃
建设社会主义新农村,发展农村经济是基础,增加农民收入是关键。近年来,会理县立足资源优势,以发展特色农业为突破口,推进特色农业产业化建设,有力地推动了全县农业和农村经济快速健
<正>信息技术特别是移动互联网的迅猛发展,使信息存储、传播、获取等发生了巨大变化,传统图书馆仅通过购买纸本文献资源、电子教据库资源已经无法满足读者随时随地获取信息的