基于NRSFM的动态场景三维重建方法研究

来源 :陕西科技大学 | 被引量 : 0次 | 上传用户:aiming5968f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从二维图像序列中恢复出物体的三维结构信息和运动信息一直以来都是三维重建领域的一个热点问题。现实世界中很多物体都是非刚性的,这些非刚性体的运动信息除了旋转和平移之外,还具有“变形”这一特征,这意味着物体每一帧的结构都发生了变化,因此,通过运动信息求解非刚性体三维结构的问题变得相对复杂。近年来,虽然很多学者都针对这一难题展开了研究并且提出了一些方法,但是仍然存在以下两个问题:1、其重建对象大都是稀疏的特征点,并不能够模拟物体复杂的非刚性变形以及恢复其细节信息,局限性较大并且应用范围较小;2、该方法图像序列获取的方式是相机单侧采集,其恢复出来的仅仅是目标物体单个方向的结构信息,三维信息并不完整。基于上述问题,本文采用 NRSFM(Non-Rigid Structure From Motion)方法得到人体单侧稠密点云,并融合SMPL(Skinned Multi-Person Linear)模型开展对动态人体序列完成三维重建的研究。具体地:(1)图像序列中稠密像素点的匹配。作为NRSFM算法的第一步,图像序列帧间像素点匹配的结果直接会影响到三维重建的效果。针对相机连续采集的一组人体运动的图像序列,利用物体在二维图像中点的“轨迹高度相关”这一特性解决多帧光流问题,完成稠密像素点的匹配。通过假设二维图像像素点的轨迹在一个低维线性子空间附近来建立这个性质的模型,即将二维轨迹解释为三维基形状的线性组合的投影,或者解释为二维运动基的线性组合。首先,选取图像序列中任意一帧作为参考帧,然后估计参考帧中每个可见点在整个图像序列中的二维轨迹,找到参考帧中每个像素点在剩余子序列中的位置,最后将匹配好的人体运动的每一帧稠密像素点按顺序写入测量矩阵W中,得到NRSFM算法的输入。该方法通过时间信息能够预测特定帧中不可见点的位置,从而可以减小由于自遮挡或者外部遮挡所带来的影响。(2)基于NRSFM的三维重建方法研究。首先研究了具有对偶关系的两种NRSFM算法,第一种是形状基表示法,在形状空间中,将物体的三维结构描述成K个形状基的线性组合;第二种是轨迹基表示法,在轨迹空间中,将物体的三维结构描述成K个轨迹基的线性组合。然后通过数据集中的人体运动数据对上述两种方法进行验证,结果表明:形状基表示法要想恢复每一帧的结构,需要重新估计序列帧,运算量大,且严重影响重建效果;轨迹基表示法由于提前定义了轨迹基,整个过程只需要估计系数,重建精度较高。最后基于(1)中人体运动的测量矩阵W,通过轨迹基表示方法得到了连续帧的人体单侧点云。(3)融合SMPL模型的人体三维重建。提出了一种单侧点云融合SMPL模型对人体进行三维重建的一种方法,该方法的本质就是寻找到合适的体型参数β和姿势参数θ。具体地,在(2)中基于轨迹基表示法得到连续帧的人体单侧点云之后,将重建的人体单侧点云结合SMPL模型构造优化函数,使得人体模型与输入的单侧点云之间达到最优配准,求解出体型参数和姿势参数,最后将求解出的体型和姿势参数输入SMPL中生成动态的人体三维模型序列。实验部分为了定量的比较本文方法与HMR方法的重建的效果,基于RGBD融合SFS(Shape From Shading)方法建立了标准的人体三维模型,再将上述两种方法重建的人体模型分别与标准模型进行配准计算,最后得出本文重建效果更好的结论。
其他文献
姿态信息指的是物体绕其自身三轴转动时产生的角度信息,在航空领域也称之为横滚角,俯仰角,偏航角,这个信息的实时准确获取是非常重要的。本文首先分析了姿态信息的组成要素,研究各种姿态算法,并通过对比各算法的优缺点,选择最优的算法。其中:物体在静止状态或者匀速直线运动时的俯仰角度、横滚角度信息可以通过测量重力加速度在物体三个轴上的分量计算得到,而重力加速度分量则由三轴重力加速度传感器来测量;当物体进行加速
在智能电网中,智能变电站是保证电力系统能可靠运行的关键设施,智能变电站发挥着电能转换、传输、分配、控制的重要作用,是电力系统的枢纽。智能变电站引入IEC61850通讯规约,
图像分割作为图像理解和机器视觉的共同基础和前提,在图像分析处理中占据非常重要的地位。目前,它已在人们的实际生活和工作中显现出越来越重要的作用,如生物医学工程、智能
背景:结直肠癌是临床上常见的消化系统恶性肿瘤,具有高发病率和高死亡率。多数患者在确诊时疾病已发展至中晚期且出现转移,因此寻找抑制肿瘤转移的靶点显得至关重要。由于启动子区域甲基化程度升高,细胞膜蛋白瞬时受体电位M通道家族成员 TRPM4(Transient Receptor Potential Cation Channel Subfamily M Member 4)在结直肠癌组织中表达较正常肠粘膜显
伪装语音检测是通过对说话人的声音进行分析,进而识别出它是真实说话人的语音还是人为恶意伪装的语音。伪装语音通常由人为模仿、设备回放、语音转换及语音合成技术生成,通过
太赫兹作为微波与红外之间的桥梁具有独特的性质,因而成为近些年来研究的热点,但是以前的研究点侧重于太赫兹波的吸收、透射、幅度和相位调控等,相应的太赫兹波吸收器、调制
大数据时代,海量数据在网络上产生和传输,被不同组织存储、转化和利用。数据起源记录数据从产生到消亡的整个生命周期内涉及的数据实体、处理过程以及相关的人员和组织。数据
深度学习方法在极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)图像分类中有着非常重要的地位,其目的是通过大量的标记数据对模型进行训练,从而挖掘更丰富
随着大数据时代的到来,卷积神经网络(CNN)因在图像分类方面显示了优越的性能成为深度学习领域的研究热点,但基于深度学习模型是由大量数据训练得到的,常被视为“黑盒子”,缺
耕地资源开发、利用及保护问题影响国家农业发展及国家经济发展,耕地的合理利用与保护问题一直是土地问题讨论的焦点之一。以往的研究基本上揭示了耕地质量的现状与发展趋势,但较少涉及耕地质量影响因素间的空间耦合。本研究通过对奉新县耕地质量主导影响因素进行空间耦合性分析,可以为南方丘陵区耕地质量提升提供对策,对耕地质量评价指标体系的简略及评价提供一定指导,为耕地的合理利用与保护提供科学依据。本文通过参考文献资