论文部分内容阅读
近些年,三维模型检索领域使用深度学习的方式获得了飞速发展,对于三维模型结构复杂、信息量大等特点,将其投影为2D图像的识别方法取得了突出的效果,但对于投影方法以及深度学习的特征提取方法都对三维模型的识别效果存在不同程度的影响,本文针对三维模型的2D图像的特征识别进行研究,具体工作如下。(1)主成分分析方法(PCA)具有非相关性的特征压缩能力,将深度学习与PCA方法相结合,降低整体的冗余特征,其中使用区域划分方法极大地关注于局部特征的表达,最后多视图的三维模型使用均值融合方法表示其全局特征。在CNN框架中增加此方法后形成一个端到端的平衡主成分(Balanced Principal Component Network,BPCN)网络。在ModelNet40数据集上的分类效果及mAP值分别从93.8%和93.2%提升到95%和94.6%,对每个类50个模型和数据库每个类20个模型下的平均top-10检索精度为98.5%,在ModelNet10上的平均top-10检索精度100%。(2)在BPCN的基础上优化了主成分分析与深度学习的结合方式,自适应幂权值方法通过改进Box-Cox技术对奇异值特征进行加权操作,可以在神经网络训练过程中加速参数的拟合,并且极大程度地减少了参数数量。其结构分为三个部分,首先对特征进行子区域划分,形成一系列局部特征,其次对这些特征计算其最大或平均的奇异值作为三维模型的特征描述符,通过后向传播的方式对奇异值特征进行参数学习,与CNN相结合形成一个自适应的动态奇异值网络(Dynamic Singular Value Network,DSVN)。在ModelNet40数据集上分类结果及mAP值为95%和94%,平均top-10检索精度为98%,在ModelNet10上的平均top-10检索精度99.9%,DSVN相比BPCN在两个数据集上的训练时间平均减少三分之一。(3)针对多视角的三维模型投影和特征分类问题,提出了一种倾斜式投影方法和模型库分类方法,倾斜式投影方法在三维模型的“有效视角”内进行投影,增大模型与模型之间的特征差异,对刚体模型有很好的效果。模型库分类法根据训练集自适应地建立一个模型库,去除CNN中的错误分类结果,在分类过程中通过对比模型库中的特征进行分类。倾斜式投影法在分类精度达到95%的基础上贡献0.4%到1.3%,在同样的分类精度基础上,模型库分类法相比于SVM分类法提升0.5%到1.5%,两种方法相结合在ModelNet40数据集上的最高分类精度为96.9%,在ModelNet10数据集上的分类精度最高为98.5%,分类时间较SVM减少50%到66%。