论文部分内容阅读
近年来,三维扫描和虚拟现实等数字几何处理技术得到了飞速发展,三维模型数量和质量也随之不断提高。对这些数量庞大的三维模型进行处理、分析和语义理解,并且利用这些语义信息对三维场景进行更深层次的理解,已经成为数字几何领域研究的焦点。机器学习是人工智能研究的核心课题之一,不但有深刻的理论内蕴和坚实的数学基础,也是计算机科学中的众多领域中解决问题的有效手段。以卷积神经网络、超限学习机和支持向量机为代表的有监督学习技术在工业界和研究界都表现出了相当优异的性能,是解决问题行之有效的一种手段。本文围绕着利用有监督学习技术解决三维模型分析和理解中的难题展开研究,在三维模型描述子、三维模型分割、三维模型分类和三维场景理解方面进行了如下工作。1.基于人体动作交互的三维模型描述子。三维模型的功能分析是高层次数字几何处理中的重点问题。由于大规模三维模型库中类间差异和类内差异较大,因此对这些模型进行合理的功能分析一直是极具挑战性的问题。传统三维形状分析方法很大程度上依赖于基于三维模型表面属性的形状描述子,难以满足功能分析的需要。本文提出了一种基于虚拟人多层次动作交互的三维物体描述算子,利用与三维物体最佳匹配的虚拟人动作,计算出多层次动作匹配向量,该向量即为物体的描述算子。由于虚拟人动作中隐含的语义信息,本文的方法在三维物体分类和同类三维物体一致分割中取得了良好的效果。基于人体动作的三维模型描述子还在三维室内场景的物体识别与重建中得到应用。2.基于超限学习机的三维模型分割和标注。三维模型分割是计算机图形中的基础问题。本文提出了基于超限学习机的快速三维模型分割与标注方法。针对带有标注的三维分割数据,首先计算三维模型的诸多特征,基于这些特征训练超限学习机分类器,然后在测试三维模型上预测初始分割结果。最后,利用三维模型过分割的边界和主动轮廓算法计算的边界,通过图割得到最终的分割结果。大量的实验结果表明本文的方法在两个数量级速度提升的情况下,在单个三角形层次和过分割层次都取得了相当好的分割和标注结果。由于方法速度提升,在大规模三维模型分割上也取得了良好的效果,并在单个三角形层次上实现了基于在线序列学习的三维模型分割方法,在过分割层次上实现了实时的三维模型分割方法。3.基于多角度多层超限学习机的三维模型特征提取。三维模型的特征提取是高层次三维形状分析的核心问题。传统基于经验的三维特征设计过程复杂,特征提取过程缓慢,并且在不同应用场景下很难具有通用性。生物神经学家通过实验证实,人类视觉神经皮层对三维物体的认知通过多个深度信号组合而得到。基于此,本文提出了基于多角度多层超限学习机的自动三维模型特征提取方法。该方法首先从不同角度对三维物体生成一系列深度图像,随后提取该三维模型多层次的三维特征。这些三维特征可以通过配套的可视化神经网络进行可视化,从而让用户更深地理解这些特征。实验结果表明本文方法在三维模型分类、三维模型分割和深度图像物体检测和分类上取得了较好的效果。4.基于卷积-自动编码机的三维特征提取。三维形状特征在三维物体分类、检索和语义分析中起着关键的作用。传统的三维特征设计过程繁复、提取过程耗时,而且不能从已有的大量三维数据中自动提取特征。在深度神经网络的研究领域中,卷积神经网络和自动编码机是比较流行的两种网络结构。本文在超限学习机的框架之下,将两者结合起来,提出一种基于卷积-自动编码机的三维特征自动学习方法。实验结果表明,本文的特征学习速度比其他深度学习方法提高约两个数量级,且提取的特征在三维模型分类、三维物体检测等任务中都取得了良好的性能。