论文部分内容阅读
三维场景建模一直以来都是计算机图形图像处理和计算机视觉中最活跃的研究领域之一。它在工业设计与制造、娱乐、教育、视听艺术及军事等方面都有广泛的应用。研究人员对三维场景建模做了很多的探索,在这些工作中如下的两方面非常具有代表性。一方面是基于图像的三维场景建模。由于它直接以从真实场景获得的图像为基础生成虚拟场景,因而它产生的场景逼真、自然。基于图像的场景建模通常包括特征提取与匹配、相机标定、立体匹配、深度恢复和深度插值等关键组成部分。另一方面是三维场景的自动创建。由于它融入人工智能领域的相应知识到三维场景创建过程中,提高了场景的智能化创建程度,因而它使得三维场景建模更加方便和高效。三维场景自动创建的关键在于通过空间推理等有效的方法确定场景中对象的布局。
本文针对以上具有代表性的两种三维场景建模方法进行研究,研究解决其中的关键技术问题,包括相机标定方法、特征描述方法,以及三维空间中的定性空间关系的描述与推理、含空间推理的对象布局算法,研究含空间推理的三维场景自动构建的框架体系等,通过解决这些关键技术问题为三维场景建模提供支撑。
本文的主要工作及创新点如下:
1.提出一种在线重标定的框架。该方法分为初始标定和重标定两个阶段。除初始标定阶段需要使用标定模板外,针对同一场景所做的重标定不再需要使用标定模板,因而不需中断在线任务的执行。能自动维持计算机视觉和摄影测量任务中的相机标定。并且在时间效率和精确性方面,相比在线自标定方法,取得更好的性能。
2.提出带有旋转角策略的改进的基于旋转运动的自标定方法。该方法考虑了相机旋转过程中的平移。在标定之前先计算了相机不同旋转方位之间的旋转角,然后在不同的旋转角情形下使用不同和非常合适的策略进行自标定。相比基于相机纯旋转运动的自标定方法,该方法获得了更高的标定精度,由此产生了更好的标定结果。
3.提出一种基于SIFT的特征描述符框架。通过将颜色和全局信息合成到SIFT描述符中,提高特征描述符的特异性和鲁棒性,减少特征匹配时的失配。其中,使用对数极坐标直方图分别构建了框架中的三个颜色不变性分量和全局分量。在构建特征点描述符过程中,通过为每一个特征点计算和使用椭圆邻域,使描述符框架对通常的图像仿射变换保持了良好的不变性。
4.研究三维空间下的定性空间描述和推理,提出了一个以场景的文本描述作为输入,基于Maya的含空间推理的三维场景自动创建方法及其框架。该方法最关键之处在于给出了含空间推理的对象布局决定算法,该算法对从场景描述文本中抽取的定性空间方位关系进行了定量化处理,同时使用对象的包围盒通过冲突检测来推理求得各对象的具体摆放方位。该方法融合场景自动创建和现有的优秀的图形引擎的优势,快速有效地自动构建了三维场景,也为后续的在三维场景基础上的进一步操作提供了方便。