Hierarchical Reinforcement Learning With Automatic Sub-Goal Identification

来源 :IEEE/CAA Journal of Automatica Sinica | 被引量 : 0次 | 上传用户:l398655579
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In reinforcement learning an agent may explore ineffectively when dealing with sparse reward tasks where finding a reward point is difficult. To solve the problem, we propose an algorithm called hierarchical deep reinforcement learning with automatic s
其他文献
近年来,我国建筑行业高速发展,市场上各种计量与计价软件也层出不穷,这些软件无论是在专业水平还是计算能力方面都可以满足工程需要。但随着建筑设计的多样化、建筑结构的复杂化发展,建筑工程的信息化水平也在不断提高,在计量与计价的过程当中运用BIM技术成了一个重要的趋势,这促进了工程量计算方法的创新,工程量的计算规则、消耗量指标以及BIM技术实现了有效融合。基于此,文章运用文献分析法、归纳总结法,探究了BIM技术在建筑工程计量与计价中的应用,希望为造价管理人员提供参考与借鉴。
当前我国新能源日渐增多,新能源接入电网后,电力系统运行安全性及电能质量容易出现问题,影响整体电力系统运行稳定性,容易发生安全事故,因此加强电网规划中的新能源接入影响分析研究意义重大。文章首先阐述当前电网规划中常见的新能源类型,并探讨电网规划中的新能源接入的具体影响,以期为促进新能源推广应用提供一定参考。
民用建筑大多是为人们提供居住环境的,由于民用建筑通风空调安装工程具有设备多、能耗大、管道占据空间大、施工量大、施工难度高等特点,在施工过程中的任一环节,倘若处理不当,将会影响到系统功能的实现,不利于空调安装的质量控制。文章就民用建筑通风空调安装施工过程中的质量控制问题进行分析,并提出相应的解决问题的办法,旨在保证施工质量以及后期的使用。
针对目前通信专业移动通信课程授课中存在的课程内容知识面广原理复杂且跟不上技术更新,实践设备过时而与实际工程应用脱节等问题,学校基于校企合作协同育人理念,对移动通信课程的教学内容、教学方法进行了改革,并依托企业提供的e-Bridge平台开展实验及实训项目,使学生进一步了解移动通信系统结构、认识整网的运行环境,掌握基站工程安装及网络优化知识。
2016年至今,弘扬“工匠精神”早已成为社会共识,但人们对其研究存在局限性,部分高校对其内涵和价值的认识仍存在不足。同时,随着高等教育的快速普及,高校毕业生数量屡创新高,就业难这一社会问题日益突显。基于上述背景,文章通过分析“工匠精神”在高校中的发展情况,针对企业与高校二者之间人才“供给”与“需求”断层这一问题,创新性地提出了以“工匠精神”为核心的校企协同发展策略,进而为校企之间的协同发展提供强有力的理论指导。
This paper investigates the event-triggered security consensus problem for nonlinear multi-agent systems(MASs)under denial-of-service(Do S)attacks over an undirected graph.A novel adaptive memory observer-based anti-disturbance control scheme is presented
塑料检查井俗称塑料“窨井”,是设置在塑料排水管道交汇处、转弯处、管径或坡度改变处、跌水的地方或直线管段上每隔一定距离处,便于定期检查、清洁、疏通管道的排水附属构筑物。在旧小区改造过程中,最大的难点在于小区仍在使用,无法按照正常程序施工,即旧小区内的排水管道和旧砖砌检查井仍在使用过程中,管道中有源源不断的污水排出,如何在使用过程中切换塑料成品检查井,是改造工程最大的施工难点。
This paper proposes a control strategy called enclosing control.This strategy can be described as follows:the followers design their control inputs based on the state information of neighbor agents and move to specified positions.The convex hull formed by
近年来,随着建筑行业的大力发展,机械成孔灌注桩越来越多。对于一些桩基基础工程,常需要穿越地层地质条件复杂、地下水含量丰富的土层,如何做到快速高效地完成灌注桩施工,成为施工中的重点及难点。基于此,文章结合工程实例,对旋挖机械成孔灌注桩施工要点进行了探析,从而更好地提高施工质量。
Formation control of discrete-time linear multi-agent systems using directed switching topology is considered in this work via a reduced-order observer, in which a formation control protocol is proposed under the assumption that each directed communicatio