论文部分内容阅读
几何模型拟合的任务是对数据点集(如图像或激光扫描点云)进行建模,即找出能够最佳地解释给定数据的真模型(如直线、圆、字符、建筑物等)。它的应用范围极其广泛,从逆向工程与计算机视觉中的曲线重建,到复杂城市场景的建筑物三维重建都属于几何模型拟合的范畴。目前大多数的几何模型拟合工作研究的是对经典模型的拟合。然而有很多复杂的数据无法用经典模型来解释。本文研究的程序式模型拟合是经典模型拟合的推广。理论上,它可以对任意复杂的数据建模。因此,相比经典模型拟合,程序式模型拟合无疑具有更加深远的理论研究意义和更加广阔的实际应用价值。然而,实现程序式模型拟合的主要难点在于:一是如何设计相似度估计子使得真模型与数据的相似度是唯一最大的,以保证最优化算法能够找到真模型;二是如何设计最优化算法以快速地找到最相似模型;三是如何编写恰当的概率程序以利于准确和快速的拟合;四是如何对原始数据进行恰当的处理以方便拟合。一般来说前两个难点是理论难点,后两个难点与具体应用有关是应用难点。因此,本文首先从理论上研究程序式模型拟合,即针对前两个难点提出了新的解决方案。然后本文探索了程序式模型拟合在三个方面的应用价值即基于图像的手写字符识别、基于车载移动激光扫描点云的道路曲线和建筑物表面三维重建。具体来说,本文的主要工作和创新点如下:(1)针对难点一,提出了一个新的相似度估计子来估计几何模型与数据间的相似度。该估计子是基于模型到数据的误差,而现有的大部分估计子是基于数据到模型的误差。实验表明,该估计子比当前主流的估计子更严格且更稳健。(2)针对难点二,提出了一个从粗到细的模型分割策略以提前拒绝不相似模型,从而加速最优化过程。实验表明,采用了这种提前拒绝策略后,当前主流的最优化算法(如马尔科夫链蒙特卡洛和杜鹃搜索)能够被加速大约三倍。此外,还提出了基于深度强化学习的多模型拟合方法。实验表明,该方法所需的拟合迭代次数比杜鹃搜索算法减少几十倍。(3)本文应用程序式模型拟合方法实现了在图像和激光点云数据上的模式识别。第一个应用是在18个不完美图像数据集上进行字符几何模型重建并实现了少样本识别。实验表明,在5样本识别中,本文方法在其中的13个数据集上超过了当前最好算法(George等2017 Science)[22]。尤其是在受到网格线污染的数据集上,本文方法取得了高达65%的准确度,而当前最好算法只取得30%的准确度。第二个应用是在车载移动激光扫描点云上实现了道路曲线的三维重建。针对本应用中的难点四,提出了一种基于强度方差的路面标识提取方法。实验表明,本文方法在路面标识提取上比基于强度梯度的方法[137]更有效,重建出的道路水平圆曲线的半径的绝对误差不超过20cm。第三个应用是从车载移动激光扫描点云中重建出三维程序式建筑物表面模型。实验表明,本文方法可以较好地处理含连续变量的以上下文有关文法表示的模型。与之相比,当前主流算法处理的是含离散变量的以上下文无关文法表示的模型。总之,本文深入地研究了程序式模型拟合问题,在一些难点上提出了新的解决方案,探索了在模式识别中的若干应用并取得了当前最好效果。本文提出的程序式模型拟合算法的主要缺点是计算量偏大,使其可能无法适用于一些对计算速度有较高要求的任务。未来还需在算法的加速等方面上展开更多研究。