基于图像的城市场景三维模型重建

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:liongliong492
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件显示设备和虚拟现实技术的发展,具有真实感的数字化城市受到人们越来越多的关注。数字化城市在城市规划、三维地图、古迹保护和虚拟仿真等方面发挥着重要的作用,并有巨大的应用潜力和市场价值。建筑物是城市场景中重要的组成部分,也是数字化城市的主要对象。如何有效地重建建筑物的三维模型一直是数字化城市的研究热点。  基于图像的模型重建方法由于其数据获取的便捷性、经济性和高效性,为数字化城市提供了一条有效的途径。基于图像的三维模型重建技术是一项系统工程,它包括基于图像的三维点云获取,几何结构的恢复和场景的绘制等过程。随着计算机视觉技术和图形学技术的发展,人们已经可以从图像中获取稠密的点云数据。具有高度真实感的场景绘制技术也已经较为成熟,但是如何从点云中获取建筑物的三维模型这一问题仍然没有得到解决。城市建筑模型重建的难度主要存在于三个方面:(1)建筑中通常含有很多的尖锐结构(如线段、平面等),如何在模型重建过程中保持这些尖锐结构是建筑模型重建的难点之一;(2)城市建筑的结构通常具有高度复杂性和多样性,如何通过数学建模的方法对建筑模型进行表述是建筑模型重建的难点之二;(3)基于图像的方法获取的点云通常含有严重的缺陷,例如噪声和缺失等。如何从有缺陷的点云中恢复完整、准确和简洁的建筑模型是建筑模型重建的难点之三,同时这也一直是计算机视觉和计算机图形学领域一个重要的研究课题。本文围绕上述问题开展相关研究,主要贡献如下:  提出了一种基于图拉普拉斯正则的平面分割模型,并将其用于城市建筑点云的平面元素提取。该方法在全局上采用一种线性投影模型进行分片平面拟合,在局部上采用图拉普拉斯模型保持局部的一致性。图拉普拉斯有效地整合了建筑的多种先验信息,从而显著地提高了分割的准确率。该模型可以通过乘性更新的方法快速进行优化。与已有的方法相比,本文的方法能够同时处理多个平面结构且对参数不敏感。真实数据和仿真数据上的实验结果表明,该模型对噪声鲁棒,具有较强的平面分割能力。  提出了一种基于断层的全自动城市建筑模型重建算法,用于从点云中恢复建筑的三维模型。该方法的核心思想是首先将建筑沿垂直于地面的方向切割成一系列断层,然后在每一片断层上自动重建分段线段的平面轮廓并从中提取主导平面轮廓。之后将主导平面轮廓作为标签通过马尔科夫随机场传播到其它断层中。这样建筑的三维模型重建问题便转化成了基于马尔科夫的多标签分配问题。为了准确地提取和传播主导平面轮廓,本文提出了一种基于语法编码的方法来准确地度量平面轮廓之间的相似性。此外,为了恢复建筑模型表面的窗户结构,本文提出了一种基于图像的模型编辑方法,该方法对于场景中重复出现的窗户结构十分有效。本章的重建算法适用于分段平面且与地面垂直的建筑,其主要优点是能够保持建筑的尖锐结构,同时生成简洁、水密的模型。大量真实数据上的实验结果验证了本文算法的有效性。  构建了一套实用的基于图像的大规模城市场景模型重建系统。该系统在集成了基于图像的点云生成技术和由点云到模型的重建技术的基础之上,实现了全自动的纹理图像拼接与编辑功能。该系统输入多视角图像序列,自动输出真实感较强的纹理模型。由点云到模型的重建直接影响到纹理模型的真实感,针对城市场景航拍图像得到的点云数据,本文对几种常用的表面重建算法的性能进行了测试和评估,从而为城市场景的模型重建提供参考。该系统能够对较大规模的城市场景进行自动重建,并支持测绘学中矢量数据的交互式采集和输出。实验中多个重建范例验证了该系统的有效性。
其他文献
本文在分析石油化工行业企业信息化的现状和需要解决的问题之后,结合现场总线技术对企业信息化发展所提供的技术支持作了探讨。在此基础上,提出了基于现场总线技术设计和实现物
正电子发射断层成像(Positron emission tomography, PET)可以在体监测放射性标记探针的分布情况,提供代谢信息,反应肿瘤发生发展扩散的情况,因此被广泛用于多种疾病的早期诊断
隐写术主要研究如何将隐秘信息隐藏于正常载体中,它是实现隐秘通信的主要技术手段之一。隐写分析的目的是检测数字媒体中是否存在隐秘信息。本文研究了基于图象特征和基于攻击
由于酸碱中和反应中pH值呈现严重的非线性及大时滞,给pH值控制带来极大的困难,pH值一直被公认为最难控制的变量之一。 为提高教学和科研水平、学生的工作能力及对非线性算法
语音识别技术是人类迈向高度智能化和自动化的信息社会所必备的关键技术之一。经过几十年的艰苦探索和研究,语音识别技术研究获得了极大的发展,某些比较成熟的技术已经逐步应用
本文研究基于广义粒子模型的分布并行智能处理的理论和方法。通过引力场中广义粒子的运动学和动力学模型,研究复杂环境和复杂交互模式下群体智能的演化机制,建立个体微观行为与
IGCC(Integrated gasification combined cycle)是最有发展前途的洁净煤发电技术之一。世界上许多国家都投入了大量的人力、物力资源进行相关研究,现已经进入商业示范阶段。然
非平稳信号分析是信号处理学科的重要领域,也是一个难点,其目的是分析和处理非平稳信号的局部特性,用某些时变的统计量来刻画信号。本论文对非平稳信号的自适应分解算法及应用进
文字识别是模式识别领域的核心分支之一,近年来,场景文字识别这一子问题得到研究者的广泛关注,场景图像中的文字识别对比传统的印刷文档识别和手写文档识别有其独特的问题,例如图
在研制数字伺服系统的整个过程中,调试工作是必不可少的一环,它决定了系统研制工作的成败,并最终决定了系统实际达到的技术指标,而集信号产生、显示、记录功能于一身的数字伺