论文部分内容阅读
非刚体运动重建,是计算机视觉领域的热点研究课题。该技术主要研究如何从二维动态视频序列中恢复非刚体对象的三维结构和摄像机运动的相关参数。该技术可以广泛应用于机器人视觉、医疗成像、军事侦察、体育训练、影视制作等诸多领域。该问题的求解最早在形状空间中进行。其算法的核心思想是,利用因式分解法对投影矩阵进行分解,再利用线性组合的方法,通过预定义的形状基对非刚体运动进行表示,从而通过迭代求得相关参数。最近几年,根据轨迹空间和形状空间的对偶性原理,研究者提出了基于轨迹基表示的因式分解法。该方法克服了形状空间方法求解过程中,基的选择困难和算法不稳定等问题。并且相较于形状基方法,轨迹基算法的计算规模有所降低。但在非刚体运动发生突然变化时,由于轨迹基表示法中高阶参数信息的缺失,重建工作会引起较大的误差。为了解决这一问题,本论文从轨迹表示的角度进行了以下研究工作:(1)通过对非刚体运动轨迹特点的分析,结合轨迹分段表示算法,利用轨迹空间特征点运动的相对独立性,对非刚体对象特征点的运动轨迹进行描述。即通过对轨迹突变点的检测,得到轨迹突变位置和对应的轨迹坐标,再利用插值的方式恢复出完整轨迹。接下来通过多维坐标突变点的整合方法,解决了同一特征点多维坐标分量突变点不统一的问题。从而建立了不同于形状基表示法和轨迹基表示法的非刚体运动描述模型。(2)在用于描述非刚体运动模型的线性分段表示算法研究中,从时间序列的角度,本文提出了一种基于Mann-Kendall趋势检验的滑动窗口Mann-Kendall突变点检测与分段表示算法,并对该算法的相关参数设置进行了研究。通过对多种时间信号序列的分段表示实验,表明在相同压缩率下,滑动窗口Mann-Kendall算法在复现精度或运算速度等方面,相较于已有的算法有一定的优势。(3)在轨迹分段表示算法和非刚体运动描述模型的基础上,本文结合因式分解法、正交约束、投影误差约束和轨迹连续约束,提出了一种基于轨迹分段表示算法的非刚体运动重建算法。并利用该算法对多段非刚体运动视频序列进行三维重建工作。通过与轨迹基表示法重建效果的比较,表明对发生突变的运动轨迹,该方法能够显著改善突变位置附近的重建效果,在整体重建精度上也有一定幅度的提高。而相较于形状空间和轨迹空间的其他常见方法,该算法也能优于或接近于它们的重建精度。