基于强化学习的人机协作系统角色自适应分配方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:xqxcb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,机器人表现出了越来越高的智能化水平。机器人可以更加积极的与合作者进行交流以便于完成共同的任务目标。因此,如何实现合作者与机器人之间的有效交互成为了智能控制领域中新的研究问题。赋予智能控制系统人机交互能力以及决策能力是实现合作者与机器人在协同作业下完成任务的必由之路,具有重要的学术价值和实际意义。本课题以合作者与机器人在搬运或者抓取任务中实现点到点的协调柔顺运动为背景。首先,针对在人机协作中机器人如何实现对合作者意图的感知与理解,构建了基于外界信息感知的人机协调运动控制方法;其次,针对如何更加柔顺自然的实现协作任务,设计了一种基于强化学习的角色自适应分配方法,实现了在人机协作过程中合作者与机器人对系统控制权的动态分配;最后,通过点到点的人机协作实验验证了本文的研究成果。本课题主要对以下内容进行研究:(1)首先,针对如何描述与分配合作者与机器人之间的角色关系问题,建立了一种既能利用合作者的智能知识,又能利用机器人柔顺能力的人-机器人系统共享控制模型。基于该模型提出了对系统协作性能的评价指标和评价方法,建立了合作过程中的综合合作表现模型,确定了在分配系统控制权角色时的分配规则。(2)其次,针对合作者与机器人之间如何有效交互以便实现协调运动问题,提出了基于力信息的人机协调运动控制方法。在接触式人机协作中,对机器人的控制伴随着力的相互作用,因此建立了人-机器人系统基于力信息采集的通信接口,并设计了基于力信息的人机协调运动导纳控制方法,并对导纳控制中参数性能的影响进行了仿真分析。(3)最后,针对人机协作系统中如何通过对合作者与机器人之间角色进行调整以实现柔顺自然的运动形式,提出了基于模糊强化学习的人机协作系统角色自适应分配方法。对强化学习模型进行了构建,设计了一种基于ε贪婪策略指导的模糊强化学习算法。系统通过不断地学习知识和积累经验,实现了对控制权的自适应分配,最终实现了提高运动柔顺性与减小合作者努力程度的双重目标。
其他文献
传统制造企业不可避免的持有库存,对库存的管理受到了越来越多的企业重视,因为管理好库存,不仅能够为企业减少部分资金,还能够保证客户的资源。企业储备原材料库存,能够保证对市场的变化做出应对,不耽误生产。但是,储备的库存量需要适度,对库存的管理要适应企业的需求,因为库存管理不当可能会给企业带来消极的影响。储备库存量太多,不仅占用了仓库的使用面积,影响了仓储效率,库存成本也随之增多。而库存量过低,就不能保
目的比较石英纤维桩和金属桩核修复前牙的效果。方法回顾性分析武汉大学口腔医院综合急诊科自2018年1月至2019年1月收治的120例前牙大面积缺损患者的临床资料。根据治疗方式不同,将患者分入金属桩核组(n=60)和石英纤维桩组(n=60)。金属桩核组患者采用金属桩核修复治疗,石英纤维桩组患者采用石英纤维桩修复治疗。比较两组的修复成功率、白色美学指数(WES)评分、主观满意度及不良反应发生率。结果两组
随着互联网和体验经济时代的到来,用户的消费观念发生了转变。传统的只注重产品的单向输出模式已无法适应消费者要求,而以用户为中心,在产品全生命周期过程中对整个用户体验过程进行服务引导和质量把控的服务设计成为一种新的设计趋势。本课题从用户需求入手,融合Kano、QFD、TRIZ等方法构建需求扩展模型,在此基础上进行用户需求和利益相关者分析,梳理服务设计要素与流程,建立基于需求扩展模型的服务设计方法,主要
随着经济的发展,大气中的恶臭污染越来受到人们的关注,传统的恶臭气体检测主要依靠人工嗅辨的方法,该方法精度低,受主观影响大,电子鼻系统是恶臭气体检测中客观检测的主要手段。检测系统中反应气室的形状和结构对系统的精度和重复性有非常大的影响。但是当前的恶臭检测系统的反应气室多数是根据经验设计,且未充分考虑气室内部的化学反应,导致电子鼻系统检测效果不佳,限制了在恶臭检测方面的应用。本文依托国家重大仪器专项“
随着社会经济的快速发展,单一产品装配线已不能满足多变的市场需要,混合装配线开始逐渐受到重视。在大型产品诸如汽车、工程机械等的装配过程中,由于这类产品体积较大,同一工作站内可以存在多名工人同时独立完成自己的装配任务的情况,这类产品的装配线组织形式一般采用多人工作站混合装配线。多人工作站混合装配线平衡和排序问题也成为了企业在装配线设计过程中必须面对的问题。论文通过分析JH公司挖掘机装配现状发现,该公司
恶臭气体作为大气污染的一种形式,通过人体呼吸系统直接对人们健康及精神状态产生危害和影响,恶臭污染的治理已经引起了全社会的重视。目前通用的恶臭检测方法还是通过传统的人工嗅辨进行主观检测,没有通过恶臭检测仪器实现对恶臭强度等级的客观评价。随着环境监测中科学执法要求的提高,以及对检测仪器快速化、网络化的需要,对恶臭检测提出了更高的要求。因此,开发一种符合人体感官评价的客观检测仪器,并且实现检测数据的平台
自从进入21世纪,世界范围内的市场竞争愈演愈烈。需求获取作为产品开发周期的起点,决定产品进入市场后是否会赢得客户青睐,对产品设计至关重要。如何获取并准确的将客户需求融入到产品设计中,是决定该创新产品能否成功进驻市场的一个重大前提。需求不是凭空想出来的,是可以通过科学系统的方式挖掘整理出来的。专利作为一种科技文献,集多种信息于一体,新颖性强,内容完整而详尽。本文基于专利知识挖掘进行产品设计需求获取与
机器人视觉系统是机器人系统的重要组成部分,通过视觉进行物体的识别和定位一直是机器人领域的研究重点。在面向卫星的移动操作臂柔性装配过程中,基于视觉的工件识别和定位可以使机械臂实现自主灵活的作业方式,进而提高在复杂背景下的装配效率。由于卫星装配过程中工作空间狭小,光照、尺度变换较大,当前识别定位系统对目标工件的识别准确率不高,定位精度较差。本文提出了一种基于改进图像特征匹配的工件识别方法,并在此基础上
立体光固化成型技术是最早被提出的快速成型技术,是3D打印技术的雏形。经过多年的发展,光固化3D打印技术正在飞速革新,技术已经逐渐成熟。相对于迟迟没有突破性进步的熔融沉积3D打印技术及金属3D打印,立体光固化成型技术发展更为迅速,尤其是近年来提出的CLIP技术3D打印机的打印速度比普通光固化快10倍到100倍。受核心器件和专利制约,国内对于立体光固化技术的研究起步较晚,近年来对立体光固化3D打印技术
共轭聚合物具有优良的光捕获能力、高荧光量子产率及信号放大能力,因此在气体检测及吸附、细胞成像以及光动力治疗癌症等方面被广泛应用。本文利用CO2刺激响应的共轭聚合物(PFBT)和氮化硼(BN)纳米棒构建复合材料,赋予复合材料双重功能,实现对CO2吸附和缓慢释放过程的检测。本论文的研究内容如下:利用共轭聚合物PFBT的CO2响应特征和BN捕获CO2的能力,通过扫描电镜(SEM)、原子力显微镜(AFM)