一种基于模型的强化学习算法

来源 :合肥工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:dyq1890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
收敛速度是衡量机器学习算法的一个重要指标,在强化学习中,如果算法不充分利用从每次学习中获取的经验知识,算法的收敛速度则比较缓慢;为了提高强化学习的收敛速度,文章将环境模型的学习引入到强化学习过程中,首先学习环境模型,然后根据所得的新模型重新指导强化学习过程,在Linux下的RoboCup仿真平台上对该算法进行了验证,实验结果证明了其有效性。
其他文献
知识经济时代的到来,对全球经济产生了深刻的影响,使会计赖以生存的社会环境发生了重大变化.会计理论、会计观念、会计模式、会计方法都必须进行创新,以适应知识经济时代的要
2006年10月21-22日,由首都经注贸易大学会计学院,理财学研究所,《经济与管理研究》杂志社及北京市总会计师学会联合主办的第五届“全国财务理论与实践研讨会”在北京香山饭店举
文章介绍了微生物燃料电池(MFC)的结构,对原有的通过质子交换膜连接的结构进行改良,并且对分体式微生物燃料电池的盐桥了进行研究,分析盐桥的孔径对整个微生物燃料电池体系产能
白色念珠菌病,又叫消化道真菌病、鹅口疮、霉菌性口炎或念珠菌病,是由念珠菌引起的消化道真菌病。近年来,辽宁阜新地区许多肉鸡场白念珠菌的发病率有所增加,给肉鸡生产带来了
经过15年的艰辛努力,中国终于成为WTO世界贸易组织的第143位正式成员.这是我国现代化建设中具有历史意义的一件大事.
用微分进化算法对暴雨强度公式参数进行优化,并将其计算结果与传统方法、优选法以及加速遗传算法的计算结果作比较,实例计算结果表明微分进化算法的拟合效果最好;相比于加速遗传
1提高认识是搞好档案利用工作的前提1.1要提高各级领导的认识要让主要领导真正做剑从思想上重视档案工作,切实加强对档案工作的领导,努力把档案工作摆到重要位置,及时帮助解决档
当前影响我区消费增长的因素有:一是基本稳定和逐步回升的宏观经济环境;二是战胜洪涝灾害造成的新需求;三是商业现代化步伐加快;四是长期收入和支出预期的不确定性导致消费行为的
笔者通过三年深入调查,在人力资本价值会计计量研究方面取得重要创新.本文主要就创新的内容进行论述.
目的探讨护理不良事件发生后护士的反应并对其不愿上报的原因进行分析。方法采取问卷法对我院160名护理人员进行护理不良事件发生后护士反应进行调查,并对其不原上报情况原因