论文部分内容阅读
非刚体三维运动重建主要研究从一组二维动态图像序列中提供的信息来恢复其三维结构矩阵和相机运动矩阵。早期的研究是在因式分解基础上对观测矩阵进行分解,结合线性组合表示方法,利用形状基和其相关系数来表示非刚体三维结构。近年来,随着形-迹空间对偶理论的提出,非刚体三维运动重建的研究被引入到轨迹空间中,利用轨迹基的线性组合来重建非刚体三维结构。该方法克服了形状基种类选择困难和求解复杂的局限,同时该方法存在轨迹基种类选择和大小选择的问题。随着稀疏表示思想的提出,用一系列稀疏的轨迹基系数自动选择轨迹基单元来对真实的轨迹曲线进行逼近,可以避免轨迹基大小的选择。但是在稀疏逼近的过程中存在轨迹基原子最佳选择问题及结构矩阵最优化问题和最优基选择问题。针对这些问题,本文基于稀疏表示思想做了以下几方面的工作:(1)针对轨迹基原子最佳选择和结构矩阵的优化问题,本文介绍了一种正交匹配追踪及加速近端梯度(简称OMP-APG)算法。首先,利用稀疏表示“最大化逼近”思想,通过正交匹配追踪算法对轨迹基系数进行求解;然后,结合预定义的轨迹基恢复出非刚体三维结构矩阵;最后,考虑非刚体三维结构矩阵是一个低秩矩阵,将其秩的最小化问题放宽到核范数最小化问题,利用加速近端梯度算法对结构矩阵进行优化。通过稀疏表示能够降低对大矩阵的计算复杂度,利用一组稀疏的系数自适应选择最佳轨迹基组合,克服了人为确定轨迹基个数的不足,结合低秩约束优化求得更加精确的三维重建效果。本文通过对不同非刚体运动模型进行实验,验证了该算法可以有效提高非刚体的重建精度。(2)针对基函数的选择和优化问题,本文结合字典学习理论和稀疏表示思想,提出了基于过完备字典学习的方法对非刚体进行三维重建。非刚体运动往往呈现复杂性和多样性,因此单一的正交基或者单纯的组合基并不能很好的去表示特征点的运动轨迹,从而导致其重建出的三维结构并不精确。本文采用字典学习的方法,同时结合原子间的非相干约束条件,通过正交匹配追踪算法进行轨迹系数求解的同时对基函数(此时称为字典)也进行更新求解。这样求得的字典包括原子种类是丰富的,因此可以多样化的表示特征点的运动轨迹,可以提高重建精度进而得到更好的重建效果。