【摘 要】
:
三维重建一直是计算机视觉研究的主要方向之一,而如何从单幅图像重建得到三维模型更是学者们一直探索的问题。针对该问题,最理想的目标是能够模拟人的视觉感受,从看到的单幅RGB图像中进行联想,依靠一生中获得的先验知识来进行推断,得到合适的三维模型。而随着深度学习的应用发展以及三维CAD数据集的不断完善,基于深度学习的三维重建方法也取得了突破性进展。针对深度学习三维重建中存在的二维特征提取、特征转换等问题,
【机 构】
:
华北电力大学(保定) 华北电力大学
论文部分内容阅读
三维重建一直是计算机视觉研究的主要方向之一,而如何从单幅图像重建得到三维模型更是学者们一直探索的问题。针对该问题,最理想的目标是能够模拟人的视觉感受,从看到的单幅RGB图像中进行联想,依靠一生中获得的先验知识来进行推断,得到合适的三维模型。而随着深度学习的应用发展以及三维CAD数据集的不断完善,基于深度学习的三维重建方法也取得了突破性进展。针对深度学习三维重建中存在的二维特征提取、特征转换等问题,本文从编码器、转码器、解码器三个部分进行改进,提出了多尺度特征提取和RNN整合的解决方案,同时提出边向量损失函数完善三维重建损失的判定,最终得到了更好的重建结果。
首先,对于单图三维重建,最重要的是如何有效的提取二维图像的特征。为了解决该问题,本文分析现有深度学习三维重建框架,以编码器-解码器网络为基础结构,设计基于多尺度的三维重建网络,使用多尺度卷积神经网络作为二维特征提取模块以获取更多的二维图像细节特征。然后通过实验对初始设计的多尺度三维重建网络进行分析,对于出现的多尺度特征整合问题,本文又提出了基于RNN改进的三维重建网络,利用RNN网络的保留和遗忘的特性进行特征矩阵整合。为了更好的对三维网格数据的重建效果进行损失判定及反向传播,本文对边向量损失进行考虑,提出EdgeVector损失函数,实现三维网格点、边、面的三方面误差判定。
最后,使用TensorFlow框架开发,在公共的ShapeNet数据集下对本文设计的三维重建网络进行训练。通过与现有3D-R2N2、PSGNet及Pixel2Mesh等三维重建网络在CD距离、F-Score值和IoU值三个标准下的对比,证明本文对飞机、柜子、汽车、显示器等大多数模型均能实现更好的三维重建效果。
其他文献
图像领域中对于图像的清晰度和分辨率要求越来越高,研究模糊图像修复和图像超分辨率重建的问题,不仅有利于提升图像的视觉质量,更是能够提升视觉应用的鲁棒性,具有重要的实际应用价值。本文在研究生成对抗网络的基础上,尝试对生成对抗网络进行改进并应用于图像处理,以解决图像模糊和分辨率较低的问题。具体做了如下研究: (1)分析和研究生成式对抗网络的基本模型和图像处理的相关内容,利用生成对抗网络处理图像已经成为
变压器局部放电是造成变压器绝缘故障的主要原因。对不同类型的局部放电进行有效识别有利于故障的定位和排除。局部放电相位分布分析(PRPD)是目前应用范围最广、效果较好的局部放电模式识别方法,该方法基于PRPD图谱进行特征提取与放电类型分类,但常用的特征提取方法均基于原始检测数据,由于不同检测设备所用数据格式不同,且不同企业对数据相互保密,造成了局放诊断方法的不通用性。 PRPD图谱具有相关国际标准,
随着智能电网的发展,针对电力设备故障的智能化检测成为研究热点。各种智能化监测设备与日俱增,电力设备一旦发生故障,将会产生大量故障数据,尤其极端天气下,更会产生井喷式数据,传统的单机处理环境已经无法应对。为解决此问题,本论文将传统故障诊断方法与Spark、MapReduce大数据框架相结合,以变压器故障诊断为例,对大数据环境下的电力设备诊断方式展开研究。 设计了深度信念网络在Spark框架上的并行
无人机航拍应用于很多领域,如交通监测、监控巡查、电力巡检、农业植保等。无人机航拍的图像处理却面临着拍摄图像分辨率高、背景复杂、易受光照、风速等天气影响而导致图像噪声过大以及对实时性要求过高等诸多问题。经典算法如Harris、SIFT(Scale-invariant feature transform)、FAST等均不能较为理想的满足实时性和准确性的要求,因此需要对无人机领域的图像预处理及图像匹配算
电力改革使得新的售电主体进入电力市场,售电公司逐渐成为发电厂与用户之间沟通的桥梁,成为了电能消耗的一个重要环节。随着电力市场改革的不断加快,售电公司若想获得更多的潜在用户并增强客户粘性,使公司稳定长期的发展,通过大数据相关技术对用户用电海量数据进行挖掘以实现针对不同用户的个性化套餐则是必然的选择。 本文在售电侧改革的背景下,重点运用了数据挖掘技术中的聚类算法,对居民用户用电模式进行了细分,最后实
电动汽车接入电网就是通过电动汽车与电网之间双向的的信息流和电力流的互换,采用先进的信息、通信技术将孤立的电动汽车和电网连接起来,使电动汽车参与到需求侧管理中,起到“削峰填谷”的作用。而在电动汽车接入电网的过程中,电动汽车用户会与电网进行双向的信息流交换,而这些信息一般会包含电动汽车用户的位置隐私、身份隐私以及电价信息、规划的充电路径等,而这些信息一旦被非法分子攻击就可能会造成用户信息被追踪、泄露或
随着深度学习的快速发展,基于大量样本的数据分类取得了重要进展,在很多数据集上,已经超越了人类的识别水平。但是,现实中很多问题的样本数量是极为稀少或者场景难以复现,用于训练的数据非常稀少,传统的深度学习方式在这种情况下效果并不理想。而贝叶斯学习可以利用参数的先验分布和少量样本来估计后验分布,实现小样本条件下机器学习。本文主要基于贝叶斯学习与深度学习结合的贝叶斯变分自编码器网络,从数据增强和神经网络搭
由于航空、医疗、自动驾驶等图像数据集中小目标分辨率低,方向错乱,背景复杂等问题,大多数目标检测算法的特征图尺度单一,不能有效融合特征语义信息,且特征提取网络经过多次采样后产生误差,损失图像中小目标的边缘特征信息,造成其识别率低,误检漏检等问题。为解决SSD(Single Shot MultiBox Detector)模型中小目标特征信息不足的缺陷,本文提出反卷积和特征融合的方法。首先针对SSD底层
当今,随着信息数量快速增长,信息过载问题越来越显著。推荐系统是解决这一问题的重要方法,可以帮助用户从大量的数据中找到可有效利用的信息,从而缓解信息过载问题。现在,大多数电子商务和社交网站等在线服务中都使用了推荐引擎向其用户显示推荐用户感兴趣的项目。YouTube上60%的视频播放量来自其主页推荐,而Netflix用户观看量的80%也来自其推荐系统。此外,推荐系统为亚马逊公司增加了35%的利润。因此
随着计算机技术快速发展,愈来愈多的网络用户通过社交平台表达对特定事物的看法。这些评论语料中蕴含大量的个人情感色彩,对这些内容加以分析利用,对预测商业形势以及社会发展态势有重要价值,这也促进了情感分析领域的发展。 对情感分析的主流方法分析如下:基于情感词典方法,该方法需要人为构建情感词典,词典构建的全面与否对准确率有很大影响。基于传统机器学习的方法,需要人工对语料进行标注,随后人工设计特征,最后使