基于Policy Gradient的机械臂运动跟踪控制器参数整定

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:a3470114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围。其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果。最后,以二阶机械臂系统为例进行了仿真验证。实验数据证明了该参
其他文献
你听说过“升降球台”吗?就是那种台面大小和常规球台一样,但是可以通过支架上的升降装置调整台面高低的球台。它主要应用于少儿启蒙训练阶段,帮助身材矮小的少年儿童进行台上击球训练,所以又称“小球台”.
6月26至27日,由中国大学生体育协会主办,中国大学生体育协会乒乓球分会执行主办,山东鲁能乒乓球学校、潍坊星朗体育文化产业有限公司承办的第三届全国高校“教授杯”乒乓球比赛,在山东潍坊鲁能乒校顺利举行。
2020年9月30日,河南省乒乓球协会第六届会员代表大会在郑州隆重召开,会议中,郑州轻工业大学的袁文惠教授被推选为河南省乒协裁委会主任。在各类乒乓球比赛现场上,经常会看到这样一位女裁判,她以优雅的气质、美丽的仪表。
The visualization and analysis of a novel acoustic-particulate system is the objective of this study. The system is composed of rice-husk fired smoke particulates (36.7 nm-840 (irn) and one annular resonant circular-tube waveguide contrarily coupled with
国乒奥运会热身赛最后一天,女乒向男队发起挑战,在国乒内部进行过的男女队关键球比赛终于呈现在了大众视野。男女乒两位世界第一的对决出现了,在让分的前提下,世界第一陈梦挑战世界第一樊振东,最后4比3挑战成功。
收费公路制度改革和取消高速公路省界收费站后,etc收费模式应成为高速公路主要收费模式。目前,河南省ETC、移动支付和现金三种收费模式并存,因移动支付收费模式使用方便,且不增加用户财务负担,发展较快以及现金收费模式仍然占据一定比例等原因,导致ETC收费模式的发展不及预期。本文在对各种收费模式的运行情况和优、缺点对比、分析的基础上,提出了大幅提升ETC收费占比、适度控制移动支付发展和尽快减少现金收费占比的建议,以更好地保障通行费资金安全,降低通行费资金存放、解缴成本,提高高速公路通行效率,促进节能减排。
针对阵列信号处理中单快拍情况下的多源时变波达方向(direction of arrival,DOA)跟踪问题,提出了一种基于单快拍空间平滑的多伯努利DOA跟踪算法。首先,利用多伯努利随机有限集(random finite set,RFS)描述状态过程的随机性,并直接利用从传感器阵列中获得单快拍量测。其次,采用空间平滑技术对单快拍量测进行处理,得到伪协方差矩阵,并进行奇异值分解。最后,用多重信号分类(multiple signal classification,MUSIC)谱函数作为伪似然函数进行多伯努利D
一、引言  新冠肺炎疫情防控档案是国家打赢疫情防控阻击战的重要基石,同时也为未来总结历史经验留下真实宝贵的记录。一旦相关档案缺失将会造成社会记忆的缺失,从而影响后续疫情防控工作的科学化、有序化开展。但是从目前档案管理的实际情况来看,疫情档案管理是一项非常繁重、复杂的工作,由于人工操作的随意性,档案存放无序,档案核查时间成本极高。因此,在疫情背景下,面对庞大、繁杂的档案数据,急需将信息化、数字化融入
《解剖学报》已经与《中国学术期刊(光盘版)》电子杂志社有限公司签署了数字版权独家合作协议,《解剖学报》自2021年1月1日至2021年12月31日将数字版权独家授予《中国学术期刊(光盘版)》电子杂志社有限公司。《中国学术期刊(光盘版)》电子杂志社有限公司在此期间拥有《解剖学报》的数字版复制权、发行权、信息网络传播权、汇编权及有关收益权。
为了分析低轨导航增强系统中信号功率增强对阵列接收机的影响,提出一种信号传播与阵列接收机的数学模型,基于该模型分析了功率增强条件下最小均方误差算法与直接矩阵求逆算法对抗干扰性能的影响。根据理论分析与仿真实验,增强信号对最小均方误差与直接矩阵求逆的影响相似,当信号增强量在15 dB以下时,阵列抗干扰对信号的影响较小;随着信号功率进一步增强,增强信号被识别为干扰并进行了抑制;当信号的信噪比增强到10 dB时,增强信号被抑制约15 dB。研究结果表明,在采用传统阵列抗干扰方法的情况下,信号功率的增强并非越大越好,