论文部分内容阅读
三维模型分类是三维研究领域的一个重要研究课题,本课题的研究依托于国家自然科学基金“3D形变体的保测变换与稀疏流形嵌入识别方法研究”。本文以三维模型为目标,重点探究不同类别三维模型的分类算法,我们改进了基于全景图的DeepPano[36]和PANORAMA-NN[37]以及基于多视角二维渲染图的MVCNN[39]深度学习算法,在基准数据集——ModelNet10和ModelNet40上均提高了分类准确率,具体工作有:·基于全景图的三维模型分类。全景图能够很大程度地表现整个模型的外围信息,因此利用全景特征进行分类是不可缺少的实验环节。本文在DeepPano和PANORAMA-NN算法基础上,通过改变输入方式和整体网络结构,提升了算法的分类准确率。我们先通过全景图生成算法,得到每个模型基于X轴、Y轴、Z轴和XYZ轴结合的全景图,然后分别送入修改过的网络,最终发现XYZ轴拼接的全景图效果最好,所以以此方式用于分类研究。·三维模型点云上采样与关键点检测。关键点的选择对三维模型分类准确率起着决定性因素,它能够反映模型的关键信息。本文先将原始模型转化成一定大小的体素形式,然后再转回网格,以实现点云的上采样,最后结合三角面片和曲率两个因素,生成了模型的关键点。·基于Spin Image的三维模型分类。Spin Image是局部特征描述子,它依据点和法向量获得,因此关键点的选择与Spin Image的生成效果息息相关。本文运用了数据增强技术,即对每个模型任意旋转一定角度。然后通过生成算法,根据每个模型的N个关键点,得到对应的N张具有旋转不变性的Spin Image,最后将这N个特征描述子当作N个视角,在MVCNN的基础框架上进行训练,并分析了不同参数组合下的结果,以获得最佳分类准确率。·基于多特征融合的三维模型分类。本文采用多种特征结合的方式来实现分类任务。我们将每个模型的深度图、灰度图和上述的全景图、Spin Image以不同的组合形式作为网络的输入,获得了每种情况下的分类效果,然后通过多特征融合网络结构,并经过详细分析得出了本文最好的结果。根据实验可知,此融合方法使得三维模型的分类准确率得到了很大提升。本文主要采用TensorFlow框架,Python、Matlab、C++语言及OpenGL实现上述研究中的算法,并进行了大量实验分析以验证算法的有效性。训练与测试样本来自普林斯顿大学提供的基准数据集——ModelNet10和ModelNet40,其中ModelNet10经过了配准处理,而ModelNet40未经过处理。我们将三维模型转换成了四种输入形式:全景图、Spin Image、灰度图和深度图。全景图表征三维模型的外围信息;Spin Image体现内部信息;灰度图展现亮度信息;深度图表示深度信息。这样就可让网络获得许多不同类型的信息,从而大大提高分类准确率。实验结果表明,基于全景图的三维模型分类算法在ModelNet10上的准确率为94.71%,在ModelNet40上为91.37%,均高于DeepPano和PANORAMA-NN算法;基于Spin Image的三维模型分类算法在ModelNet10上的准确率可达90.64%,在ModelNet40上可达86.63%;基于多特征融合的三维模型分类算法在ModelNet10上的准确率最高为95.59%,在ModelNet40上最高为92.14%,均高于MVCNN算法,且为本文最好的分类效果。