基于人体运动序列的姿态估计与身份识别

来源 :天津大学 | 被引量 : 1次 | 上传用户:zgl_0251
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会的飞速发展,人体运动分析已经引起了诸多领域研究者的浓厚兴趣。人体运动分析的研究目标是使计算机能够基于人体结构、人体运动等先验知识,自动地重建人体运动,并实现对人体行为和身份的语义感知和理解。与传统外观特征相比,三维人体骨架特征对外界光照、视角和衣着变化具有较强的鲁棒性,并且能够从生物学、物理学和人体运动学等方面对人体运动过程进行精确的描述和解释。基于此,本论文工作主要围绕人体运动分析中人体骨架三维估计和身份识别两个重点内容展开。主要研究成果如下:
  针对人体三维骨架难以直接获取的问题,提出基于黎曼流形的三维人体姿态估计方法。该方法通过分析人体运动学规律和运动轨迹的几何结构,根据黎曼流形切从结构,建立二阶随机动态模型,将RTSS平滑滤波器推广到黎曼流形,提出Riemannian Extended Rauch Tung Striebel Smoother(RERTSS)对三维骨架姿态进行正向估计并进行反向平滑。并采用局部单纯形优化方法对估计结果进一步优化。该方法能够在缺少训练数据的情况下,准确地估计三维人体姿态,并能够缓解三维重建中普遍存在的二义性问题。
  针对欧氏特征无法精确描述人体非线性运动过程的不足,提出基于黎曼流形运动特征提取方法,以实现在非线性空间中对个体差异的准确描述。针对传统度量学习方法难以体现黎曼运动特征时空结构的问题,提出时空大间隔最近邻度量学习方法(Spatio-Temporal Large Margin Nearest Neighbor,简写为ST-LMNN)。该方法将双线性模型和经典度量学习框架结合,通过双线性度量函数测量个体运动特征之间的相似性。针对个体间存在时空结构差异的问题,通过引入最近类均值分类器的思想,提出时空多度量学习(Spatio-Temporal Multi-Metric Learning,简写为STMM)。该方法通过学习时空度量函数使类内样本更趋向于类内几何平均的同时加大类间均值的距离。此外,针对大多数身份识别数据库规模较小且外界和心理协变因素考虑较少的问题,建立了包含多个外界和心理协变因素影响的运动数据库。
  针对内在和外界协变因素会对人体运动过程产生结构性影响的问题,提出时空多因素判别分析方法(Spatio-Temporal Multi-Factor Discriminant Analysis,简写为ST-MFDA)。ST-MFDA通过为每种协变因素学习成对的时空投影矩阵,将来自不同协变因素的运动特征投影到同一个公共子空间中,通过广义费舍尔判别准则保证在公共子空间中类内散度小而类间散度大,以缓解多协变因素对身份识别精度的影响。
  本文从三维人体姿态估计、时空度量学习以及子空间学习三个主要层面逐步展开,提出了一系列建模方法来解决人体运动分析中的关键子问题。通过理论分析和实验证明了所提出的三维姿态估计方法、时空度量学习方法和时空多因素判别方法在人体分析任务中的可行性、高效性以及相对于传统方法的优越性。
其他文献
纳米材料的广泛用途使其制备方法的研究越来越受重视。化学气相沉积法(CVD)是制备纳米粉体的一种很有效的方法,例如日常用的碳黑、钛白粉颜料(TiO2)等都可以用该方法制得。颗粒尺寸、尺寸分布状况以及形态等特性对颗粒产品的性能都产生极大的影响,这就要求对生产装置的结构和操作参数要有很好的了解和控制。本文应用CFD商业软件FLUENT,对火焰CVD法合成二氧化钛纳米颗粒的过程进行了详细的数值模拟。首先对
学位
高光谱成像是一种将成像技术和光谱技术成功结合的多维信息获取技术,同步探测目标地物的二维几何空间信息和一维光谱信息,获取具备分辨率高、光谱波段窄的影像数据。高光谱影像数据集地物样本的图像信息和光谱信息于一身,图像信息可反映地物目标的规模、分布、形状等外部特征,而光谱信息可反映样本内部的物理结构、化学组成的差异,所以高光谱影像数据具备“图谱合一”的性质。而正是由于这一性质,使得高光谱遥感影像在环境监控
三维人脸感知是计算机视觉和模式识别领域的热门研究课题,受到了国内外的广泛关注和深入研究。其中三维人脸的稠密对应、重建和识别是三维人脸感知中紧密相连的研究热点,三维人脸稠密对应建立了三维人脸之间的点点对应关系,给三维人脸重建、识别等研究带来了方便;三维人脸重建从人脸图片中恢复三维人脸形状,在动画制作、人脸识别等领域有广泛的应用前景;三维人脸识别能解决二维人脸识别受姿态和光照等变化影响大的问题,使人脸
本论文基于自适应动态规划(Adaptive Dynamic Programming, ADP)方法,结合反演控制法,鲁棒控制理论,自适应控制理论,对各种约束条件下的导引控制一体化(Integrated Guidance and Control,IGC)的设计进行研究,综合考虑导弹制导控制性能的稳定性与最优性。首先,建立俯仰平面内的导引控制一体化模型,然后基于此模型,主要从三个方面深入研究与分析相应
学位
针对某小型高速无人机操纵性强、稳定性差导致高速段安全性不足的问题,确立了低速段采用角速率阻尼内回路,高速段采用角速率指令内回路的纵向控制策略,并设计了过渡模态实现控制律的切换,完成了从起飞、巡航、加速与高速飞行全过程的纵向控制,解决了无人机在高速段对纵向质心偏移敏感的问题。首先,通过刚体运动模型和气动数据插值的方式对无人机进行建模,并以CMEX模型库的方式导入Matlab进行配平线性化。经过对模型
图像融合是将同一场景的多幅图像合成一幅信息更全面且内容更丰富的新图像。它是多种传感器协同完成实际任务的有效途径,可明显改善单传感器成像的不足,提高系统的稳定性与可靠性。目前,在军事、视频监控、数码摄影,医疗诊断等诸多领域都具有很高的应用和研究价值。但是由于不同类型传感器采集图像的特殊性以及图像信息复杂性,图像融合技术还没有达到预期的效果。图像融合技术涉及两个关键环节,图像表示和融合策略的设计。在图
学位
互联网的快速发展给人们带来便利的同时,也带来了诸多问题,面对海量的信息,人们常常不知道如何选择。推荐系统是帮助用户快速发现有用信息的工具,是一种为用户“量身定制”的个性化系统。它可以根据用户的偏好需求模型来进行项目推荐,在这个过程中,与用户偏好需求越匹配的项目则越倾向于推荐给用户。  协同过滤算法是最经典且最成功的推荐算法之一。传统的协同过滤推荐算法的相似度量方法忽略了用户间行为一致性的问题,导致
Language and speech are the most important and direct ways of human communication,and they have an irreplaceable role in our daily life.With the development of deep learning and the continuous advance
学位
随着DNA测序技术的不断发展,测序的正确率和速度也在不断提高。在现阶段,第二代测序技术在市场上仍占有绝对优势,其显著特点是高通量、快速、低成本。针对第二代测序数据进行的基因组测序拼接的研究中,以基于De Bruijn图的拼接算法占绝对主导地位。传统的基于De Bruijn图的拼接算法使用散列表进行构图拼接。散列表存储的数据量庞大,占用大量内存(一般占用100G以上),随着数据量的增长,插入和查询时
大规模核方法模型选择是大规模核方法理论研究和实际应用的瓶颈和关键。现有大规模核方法模型选择大多在再生核希尔伯特空间(RKHS)中经验地选择核函数并设置模型参数,没有可靠的理论保障,也没有计算有效的模型选择方法。针对这一现状,提出大规模核方法模型选择的随机映射方法,将原问题映射到显式随机假设空间,在统计上保证得到与RKHS中模型选择方法相一致的结果。具体内容如下:  1.提出循环随机特征映射方法。首