Relational Reinforcement Learning with Continuous Actions by Combining Behavioural Cloning and Local

来源 :智能学习系统与应用(英文) | 被引量 : 0次 | 上传用户:dddff628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Reinforcement Learning is a commonly used technique for learning tasks in robotics, however, traditional algorithms are unable to handle large amounts of data coming from the robot’s sensors, require long training times, and use dis-crete actions. This wo
其他文献
A new filtering algorithm — PSO-UPF was proposed for nonlinear dynamic systems. Basing on the concept of re-sampling, particles with bigger weights should be r
<正> 同工酶电泳一直是用于利什曼原虫鉴定的金标准,在地中海沿岸婴儿利什曼原虫种内有20个同工酶亚群,说明该种有高度变异性。因此,对于婴儿利什曼原虫亚种的研究,除同工酶
《陶瓷瓷质砖抛光装备抛光机》、《陶瓷瓷质砖抛光装备磨边倒角机》、《陶瓷瓷质砖抛光装备刮平定厚机》等三项行业标准审议会不久前在广东省佛山市召开,这标志着我国陶瓷抛光
本文依据科学发展观、唯物辩证法实事求是、自然辩证法最优理念、经济学朝夕阳产业、成功学方法、科学设计程序等科学发展原理,结合长吉图科技快好发展规律,提出最优发展牌、
Digital watermarking is used to hide the information inside a signal, which can not be easily extracted by the third party. Its widely used application is copyr
为了提高小麦成熟胚的分化率、研究小麦成熟胚的组培特性及筛选出高效再生的小麦品种,选取了36个小麦品种为供试材料,研究了不同愈伤诱导时间对成熟胚组培特性的影响、在分化培
【正】 在王群生赴京参加军事文学座谈会前夕,我们踏着溶溶月色,前去访问他。在他家里,倾听了作家的一夕夜谈。 开门见山,我们问起他今年的创作打算。王群生呷一口茶,沉思一
In this paper, we propose a new online system that can quickly detect malicious spam emails and adapt to the changes in the email contents and the Uniform Resou
翘嘴红鲌,别名:白鱼、白条。隶属于鲤形目、鲤科、鲌亚科。翘嘴红鲌作为一个重要的特种水产新品种,因其肉质细嫩、味鲜美,经济价值较高而养殖发展前景十分广阔。对我国的淡水渔业
6月19日,北京市正式启动了对企业、宾馆、饭店、商厦、写字楼等重点用能单位的能源计量监督检查工作。446家重点单位将受检。