Data-Driven Human-Robot Interaction Without Velocity Measurement Using Off-Policy Reinforcement Lear

来源 :自动化学报(英文版) | 被引量 : 0次 | 上传用户:zhaoqiangwudi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In this paper, we present a novel data-driven design method for the human-robot interaction (HRI) system, where a given task is achieved by cooperation between the human and the robot. The presented HRI controller design is a two-level control design approach consisting of a task-oriented performance optimization design and a plant-oriented impedance controller design. The task-oriented design minimizes the human effort and guarantees the perfect task tracking in the outer-loop, while the plant-oriented achieves the desired impedance from the human to the robot manipulator end-effector in the inner-loop. Data-driven reinforcement learning techniques are used for performance optimization in the outer-loop to assign the optimal impedance parameters. In the inner-loop, a velocity-free filter is designed to avoid the requirement of end-effector velocity measurement. On this basis, an adaptive controller is designed to achieve the desired impedance of the robot manipulator in the task space. The simulation and experiment of a robot manipulator are conducted to verify the efficacy of the presented HRI design framework.
其他文献
为从动态冲击试验中获取毁灭性碰撞时准确的特征参数,考虑动态冲击试验中台车撞击头对试验结果的影响,参考反求凸轮轮廓的设计思想,提出了根据立柱倒伏的路径反求撞击头轮廓的设计方法.此外,成功将台车撞击埋入硬黏土中的单柱有限元仿真模型校准为台车动态冲击试验,并利用校准后的有限元仿真模型对反求出的撞击头轮廓进行仿真分析,验证了反求H的撞击头能够反映桩基真实的承载能力.
为了提高卫星结构优化的设计质量和计算效率,结合径向基函数(RBF)代理模型和自适应模拟退火(ASA)算法提出了一种基于高保真度动态代理模型(HFDSM)的全局优化方法.该方法依据全局优化结果构造了一种搜索空间自适应更新策略,在优化过程中完成搜索空间的更新后,在其内部补充样本点以及重建近代理模型,并以最优解的预测误差和目标函数的下降程度作为优化过程收敛的判定准则,保证了优化的全局收敛性和最优解处的模型精确性.高维测试函数和工字梁算例的优化结果表明,该方法不仅能获得高精度的优化结果,还显著提高了优化求解的效率
为了研究地震作用下浮放物体的运动状态,将浮放物体简化为木制块体,共设计了9个试件,围绕可能发生的滑移、滑移-摇摆以及摇摆(倾覆)3种运动状态,考虑宽高比、地震波的卓越频率、体型大小、形状以及质心高度等因素的影响,采用振动台试验和数值模拟相结合的研究方法,对浮放物体的运动状态进行了系统性的研究.结果 表明:浮放物体的宽高比不同时,宽高比越大,试件越稳定,而宽高比相同时,长方体试件比圆柱体试件更稳定;浮放物体的运动响应随地震波卓越频率的增大而减弱;体型的变化对浮放物体的滑移量无影响,摇摆角随体型的增大而减小;
应用三维不可压缩大涡模拟(LES)模型结合FW-H(Ffowcs Williams-Hawkings)方程,对外置和下沉两种不同受电弓安装方式下受电弓区域流场和气动噪声进行数值模拟,在此基础上分析了受电弓舱对受电弓区域流场和气动噪声的影响.结果 表明:受电弓舱会显著影响受电弓区域的气流流动状态进而改变受电弓表面的气动声源强度和分布;两种安装方式下,受电弓区域向轨道两侧辐射的噪声均由受电弓本身所主导;与升弓状态下的受电弓相比,受电弓舱对降弓状态下的受电弓的气动噪声的降噪效果更好.
基于MSC.Dytran软件的一般耦合方法,对空化器以不同初速度垂直入水的过程进行了数值模拟,对比研究了具有泡沫铝降载机构的空化器与铝合金空化器的轴向加速度及轴向力响应规律,分析了泡沫铝构件的降载效能.结果 表明:降载空化器与铝合金空化器的轴向加速度峰值及轴向力峰值均正比于入水速度;轴向加速度幅值降载率可达70%,轴向力幅值降载率可达14%.
为提高再生混凝土(RC)的力学性能,以玄武岩纤维和纳米氧化硅为增强材料对再生混凝土进行改良,形成玄武岩纤维与纳米氧化硅复合改性再生混凝土,通过静态抗压性能试验及分离式霍普金森压杆(SHPB)试验,研究了玄武岩纤维与纳米氧化硅对改性再生混凝土破坏形态及静动态抗压强度的影响.研究表明:随应变率增大,破坏形态由完整经破裂向粉碎过渡,动态抗压强度、动态增强因子、比能量吸收均呈增大趋势;取代率对试块破坏状态、动态抗压强度及比能量吸收不产生规律性影响,但静态抗压强度随取代率的增大而降低;玄武岩纤维有利于增强试块破坏时
提出一种新型浮动基多机协调并联吊运系统,该系统由3台浮式机器人及柔索并联系统构成.以该系统为研究对象,利用D-H变换及齐次变换矩阵对整个系统进行运动学建模.根据流体力学理论建立了浮基的垂向的动力学方程.针对不同的吊运系统构型,利用拉格朗日方程分别建立了吊运系统的动力学模型.引入数值分析的思想,提出一种新的模型用于描述由于负载运动与浮基运动所产生的双向动力学耦合.并结合实例,采用数值仿真的方法,对不同耦合情况下整体系统在垂向的动力响应进行了分析比较.所得结论可用于该机构进一步的理论研究及样机研发,也可用于起
为研究波浪形底面对列车-桥梁气动荷载影响下的车桥系统振动响应,选取平潭海峡元洪水道大桥为研究对象,固定列车车速和风速,采用流体动力学软件Fluent,计算系统在横风作用及不同波浪形底面下列车和桥梁的气动荷载.基于有限元软件ANSYS和多体动力学软件SIMPACK建立三维列车-桥梁联合仿真模型,将得到的气动荷载通过时问激励方式施加到列车-桥梁系统中.研究相同车速和风速在不同波浪重现期下波浪形底面对气动荷载的影响以及车桥耦合振动问题.研究结果表明:底面为平面时,风速剖面近似呈线性增长,且风速梯度显著大于底面为
为了有效实现板件的抗振性动力学设计,研究约束阻尼板拓扑动力学优化方法.建立约束阻尼板有限元动力学分析模型,推导出模态损耗因子计算公式;建立了基于模态损耗凶子最大化目标,以阻尼层单元相对密度为拓扑变量,以阻尼材料使用量及结构频率作为控制的阻尼板优化数学模型;利用序列凸规划理论而对传统优化准则法进行改进,采用改进准则法GCMOC(global extreme point converged by method of optimization criterion)解算优化模型以求取全域性优化解,推导出面向GCM
为了寻求高烈度地区跨越地裂缝结构合理的加同措施,以西安f4地裂缝为研究背景,结合工程实例,按照刚度比原则对跨越地裂缝RC(reinforced concrete)框架结构布置钢支撑.通过振动台试验和有限元数值模拟,分析了结构的破坏形态和不同工况下支撑的应变反应,并从顶层加速度、层间位移和楼层剪力等方面对加固前后两种模型的抗震性能进行对比分析.研究结果表明,按照刚度比原则确定跨越地裂缝RC框架结构的支撑布置方式是可行的.钢支撑在结构破坏前屈服,耗散地震能量,降低结构损伤,有效提高了结构的抗震性能.同时,支撑