基于单目视觉的机器人模仿人体手臂运动关键技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:leki55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模仿和学习一直被认为是入脑智能的主要体现,让机器人模仿灵活的人体运动是人类的美好愿望,也是机器人智能的重要体现。基于标记点和运动捕捉系统的人体运动模仿系统已经比较成熟,但是基于单目视觉和不带标记点的人体运动模仿却还在研究阶段。本文对基于单目视觉和不带标记点的人体手臂运动模仿中的技术问题进行了探讨。主要研究内容及结果如下:   ⑴利用旋量理论对6自由度机械臂进行了运动学分析:利用旋量和指数积方法完成了对6自由度机械臂的运动学正问题的分析;灵活应用了paden-Kahan子问题,得到了6自由度机械臂运动学逆问题的封闭解;对6自由度机械臂存在的奇异性进行了分析。   ⑵总结了现有的摄像机标定算法,在分步标定摄像机思路的基础上,发展了一种先标定摄像机的畸变参数,再标定摄像机的内参数,最后标定摄像机的外参数的思想。由于摄像机按照小孔成像模型成像,必须满足一条基本性质:空间中的直线通过小孔成像之后在成像平面内仍然映射为直线。利用这条性质,本文提出了分组并行回归算法对摄像机的畸变参数进行校正,和传统的Levenberg-Marquart等非线性搜索算法相比,优化算法不需要别的算法来为寻优过程提供合适的初始值,因为寻找初始值的过程就存在于优化算法的第一轮迭代中。   ⑶研究了现有的从单目视频中恢复人体的运动的方法。提出了“APF+KJP”的人体手臂运动跟踪算法,它结合了由文献[41]提出了退火粒子滤波算法(annealed particle filter,APF)和文献[43]中提出基于运动学的粒子跳转算法’(Kinematic Jump Process,KJP)的特点,’APF+KJP’能够以更高的效率挖掘权值相对高的粒子,使人体手臂的跟踪更加鲁棒。此外KJP还能够一方面帮助跟踪器挖掘那些可能存在,但是目前还没有被发现的全局最优点,另一方面当跟踪器跟踪到错误的全局最优点时,KJP能够帮助跟踪器重新逼进正确的全局最优点。   ⑷在由“APF+KJP”估计的人体手臂关节角度估计的基础上,提出了手臂关节参数后续处理的“四步法”:第一步,根据‘Interpretation Tree’的构造法则,找出和所估计的手臂参数具有相同像平面投影的手臂参数;第二步,根据人体运动的惯性约束,利用动态规划算法(DynamicProgramming,DP)对手臂的关节角度进行平滑处理;第三步,由于跟踪算法中的人体模型结构与6自由度机械臂的手臂结构并不完全一样,最后,本文作者采用了“保持手臂上肢和下肢方向不变”这一准则,根据运动学的推理把人体关节角度从人体模型向机器人模型转化,得出了它们之间存在的解析关系;第四步,根据“最优后的人体关节角度和最优后的机器人关节角度空间距离最小”这一准则,对机械手关节空间角度再寻优。
其他文献
FlexRay是为汽车控制系统设计的通信协议,较全面地定义了一个网络化汽车通信过程的信息格式和功能,具有良好的可靠性、可用性、灵活性以及传输速率等汽车系统要求的关键指标。
在实际信号处理过程中,观测信号总是混杂着干扰和噪声,对信号处理的检测与估计结果有很大影响。因此,信号处理的一个基本任务就是将混杂在噪声和干扰中的有用信号准确地检测和估
客户关系管理是一个系统性的工程,是技术和管理相结合的产物。作为企业信息化的最新发展,客户关系管理实现了企业由以产品为中心向以客户为中心的转变,客户首次作为一种资源纳入
随着数字技术与计算机技术的迅速发展,数字音频工作站(Digital Audio workstation,简称DAW)出现,并且迅速替代了传统音频工作站,在广电领域内占据重要位置。广播电台的稳定性
自动人脸识别的研究有着重要的学术价值和广泛的应用前景。本文沿着统计学习与融合的思路对人脸识别中的对齐、特征表达和分类器的训练及构造三个关键问题进行了深入的研究。
随着电子通信技术的高速发展,特别是近年来移动互联网技术的发展与普及,人们对高性能、多功能、低功耗移动终端的需求更加迫切。但是随着移动终端功能的不断增多、处理性能的
基于OCR的图文库检索方法有非常广泛的应用前景。将纸质文档以图像方式保存,但却利用文档图像的文字识别结果进行检索,这使得纸质文档的保存与检索都非常方便。但出于OCR的识别
定位是移动机器人研究中一项重要的内容,也是实现导航等其他功能的前提和保证。机器人视觉是智能机器人的一个重要分支,主要完成对外界环境的感知、描述、识别和理解,是产生行为
视频监控系统是集多媒体信息的综合、计算机的交互性、通信的分布性和监控的实时性等技术与一体的综合系统。并且随着信息化产业技术的高速发展,视频监控系统已逐步涵盖到多媒
计算机视觉研究的一个主要目的是从二维图像恢复三维物体的几何结构。为实现这一目的,通常需要图像匹配、摄像机标定和三维结构计算三个步骤,其中摄像机标定是不可或缺的一步,而