基于单张RGB图像的室内场景三维重建研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dionysos223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
室内三维重建的主要任务是通过利用多个视图或者单个视图的信息,恢复室内场景的真实原貌,重建的三维场景可用在室内导航、场景理解、增强现实等领域。目前大部分三维重建的研究都只聚焦于普通的RGB透视图像,而未涉及360度RGB全景图像。此外,现有的方法在处理杂乱、多遮挡场景时往往效果不佳。针对上述问题,本文基于单张RGB全景图像,对室内场景的三维重建展开了研究。由于室内场景的三维重建研究涉及多个子问题,本文主要关注室内布局重建和室内深度估计这两个基本子问题。在室内布局重建的研究中,本文基于Layout Net和Horizon Net网络架构进行改进,提出了两种布局重建方案。第一种方案基于Layout Net架构,利用编码器-解码器结构的神经网络提取全景图的特征,得到粗略的布局估计结果,并在后处理阶段使用梯度优化算法对布局估计结果进行优化。第二种方案基于Horizon Net架构,利用深度残差网络提取全景图的特征,使用LSTM模块改善布局估计的结果,并在训练阶段加入全景拉伸这一数据增强机制,在一定程度上减小了杂乱多遮挡场景下的布局重建误差。实验结果表明,本文的第一种方案在布局预测精度和重建效果上优于原始的Layout Net网络,第二种方案在所有指标上均超过原始的Horizon Net网络及其他主流的布局重建方法。针对室内布局重建方向存在的问题,本文提出了一种面向室内场景布局重建的全景数据集制作方法,对数据采集、全景图标注、真实布局信息获取、数据集划分等一系列关键流程进行了研究,完成了真实数据集和合成数据集的制作,并利用室内布局重建的两个方案,在制作的全景数据集上实现了室内场景的布局重建。在全景数据集的制作流程中,真实布局信息的获取方法为主要创新点,该方法成功解决了角点位置的推导以及边缘图和角点图的生成问题。在室内深度估计的研究中,本文提出了两种不同的室内深度估计方案。第一种方案采用间接法,将全景图像分割、单目深度估计、深度图合成相结合,对室内全景深度图进行了粗略估计。第二种方案采用直接法,基于URes Net网络架构,利用编解码结构的神经网络在单张全景图像上估计其对应深度图。本文在实验中分析并对比了上述两种方案的深度估计结果,论证了第二种方案的优越性。
其他文献
不论贸易展还是消费展,了解"多元文化"对主办方都是重要的。现在定居在美国国土上的人群中,有1/3不是白种人。而到本世纪中叶,将有47%的美国人是亚裔、西班牙裔、非洲裔或其
西部中小型企业的生存和寿命越来越短,这就集中体现在人力资源管理上:缺乏有效的统筹谋划,基础管理差,不注重任用专业的人力资源管理者,家族式管理频繁,缺乏长效的激励机制等
广州,中国会展重镇。当然,除了会展,还有生活。生活,则是丰富多彩的。初到广州,有两件事感触特深:一为天儿热,一为蚊子狡猾。广州的天儿很热,当然,是湿热,与北方的干热明显不
英语课外阅读对全面提高学生英语素养有着不可替代的作用,因此,我们应该从营造阅读氛围、推介阅读书目、开展阅读指导、纠正阅读习惯、建立写作沙龙等方面,抓实、抓好初中英
笔者最近对圆的弧长、弦长和半径之间的关系作了研究,得到了三者之间的有趣关系式,现论述如下,和读者共享.
《中国会议》杂志曾就《会议行业对美国经济的影响力》做过一些基本介绍(见《中国会议》2011年第10期)。由于该《报告》涉及会议产业诸多数据和内容,业界研究者纷纷从《报告》发
【开场】为2010年元旦,九头鸟茶楼举办迎春杯数学竞赛——抢占2010至高顶:甲、乙两方对抢,从1开始,轮流数数,每方每次可以从小到大数1个或几个数.谁抢到2010这个数则谁赢!
加快我国农村土地流转是建立现代农业的必然要求。改革以来,我国农村土地流转程度不断提高,但总体水平较低尤其是市场化流转水平较低。造成土地流转缓慢的原因主要有农村经济
"六朝金粉地,金陵帝王州。南京——这座拥有6000多年文明史和2500多年建城史的文化名城,早以"六朝古都"、"十朝都会"的美誉闻名遐迩。会展业自发展之初,便与城市发展结下不解
采用转篮法和紫外分光光度法,对6个厂家生产的阿莫西林制剂的体外溶出度进行了考察。结果表明,不同剂型以及同一剂型不同厂家产品之同,溶出度有显著性差异。