Sample-Efficient Deep Reinforcement Learning with Directed Associative Graph

来源 :中国通信:英文版 | 被引量 : 0次 | 上传用户:zbwang12315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Reinforcement learning can be modeled as markov decision process mathematically.In consequence,the interaction samples as well as the connection relation between them are two main types of information for learning.However,most of recent works on deep rein
其他文献
城市公园是生活垃圾填埋场封场后备受青睐的再生方式.环境工程学与风景园林学是决定其再利用空间形态的关键学科.当下中国填埋场的封场再生将进入集中期,如何推进环境工程师与风景园林师的跨学科合作是该时代背景下的重要命题.结合国际优秀设计实践,依托于5项空间要素阐述了跨学科合作的关键内容.基于要素间的关系特征与封场再生过程中各阶段的特点,构建了“五要素-三阶段”跨学科合作设计途径,为更具空间可塑性的再生设计提供了可行性指导方式.
In this study,Gd and Ca co-doped ceria electrolytes with the compositions of Ce0.8Gd0.2-xCaxO2-δ (x =0-0.08) were prepared by a novel gel-casting method.The ef
We report the structural and photoluminescence (PL) properties of Nd3+-doped Y2O3-SiO2 powders(Y2O3-SiO2∶Nd3+) as functions of annealing temperature and Nd3+ i
In this paper,we consider a new spectrum sharing scenario for a cognitive relay network,where a secondary unmanned aerial vehicle(UAV)relay receives information from the ground secondary base station(SBS)and transmits information to the ground secondary u
随着中国城市土地资源的优化配置与存量利用成为趋势,城市垃圾填埋场越来越多地被改造为公园绿地、游乐场等公共活动用地,其中垃圾填埋堆体地形改造是垃圾填埋场改造中的难点和重点.垃圾填埋堆体的景观改造与一般景观地形建设相比,技术复杂性更高,设计限制条件更多.首先综述了堆体类型与景观改造目标,从堆体地形的特点、稳定性、填埋场区位与堆体形态及布局的关系等方面探讨了垃圾填埋堆体景观改造的技术要点,并结合优秀案例对不同类型堆体的景观改造策略进行深入分析与归纳,旨在为垃圾填埋场堆体景观改造实践提供相应技术与方法策略指引.
针对藏式园林文化景观的流失,以及其在构建传统聚落空间形态所起的作用被忽视的问题,引入研读文献、实地调研、居民访谈与调查比较等研究方法,从园林类型、园林组织、园林体系和管理对象等方面入手,厘清藏式园林的形成机理、空间组织与聚落空间形态演变的耦合关系,揭示与人的价值取向相对应的园林等级是构建聚落秩序的关键因素,即集民族信仰与地域文化景观于一体的乡土园林组织有利于传统聚落空间肌理的延续.认为通过探索、挖掘民族地区乡土社会的景观内涵,有助于营建、培育具有地域特色的聚落空间肌理和空间组织.
Mixed crystal strategy is an effective approach of improving the luminescence properties of optical materials and has been adopted widely in many systems.In thi
Optical thermometers have aroused considerable attention in recent years,and the increasing demand of sensitivity for practical application encourages the inves
The grain boundary diffusion (GBD) technology was used to prepare high performance Nd-Fe-B sintered magnets by NdH3 and TbH3 nanoparticle diffusion.The factors
立足当前城乡遗产保护从“资源保控”向“文化传承”的观念导向转变,聚焦山地历史城镇地域景观基因的保护传承问题.针对传统历史城镇形态保护方法“依形套式、附形失韵”的问题瓶颈,提出基于景观基因“双系统”识别解译的历史城镇空间特征保护与文化气韵传承关联操作方法.在此基础上,分别从城镇景观的格局关系、簇群形态、街巷空间、建筑风貌和地域文化的哲学基础、发展观念、实践思维、气质品性等方面,系统识别、解译了山地历史城镇的“空间基因”和“文化基因”;并据此提出山地历史城镇景观基因配对关联的保护传承措