一种用于自主学习的虚拟仿真环境

来源 :中国传媒大学学报:自然科学版 | 被引量 : 0次 | 上传用户:affairs365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
赋予智能体通过与环境交互自主学习的能力是实现下一代人工智能的关键。本文,我们介绍了一种基于虚幻4的虚拟仿真环境,用于训练和测试自主智能体。该环境具有高逼真、可交互、灵活通用的特点,使得智能体能够在其中自由探索,自主学习场景感知、常识推理、决策控制等多项能力。为了验证该环境的可用性,我们用实验演示了如何在虚拟环境中构建自主智能,即利用强化学习方法训练端到端的神经网络实现基于视觉感知的目标搜索和目标追踪任务。
其他文献
4月16日,嫦娥五号搭载《星光》登月证书颁授仪式在北京举办。近百位知名学者、外国驻华使节等各界人士参加了活动,共同探讨《星光》节目创作和传播经验,向世界传递人类命运共
按照清代的行政层级划分,州县属于最低一级的地方政权建制;由此也决定了民间诸如刑名、钱谷一类的行政和司法事物通常都是从州县最先开始的。具体到案件审理方面,州县官员实
1931年江淮水灾灾情严重。安徽省政府一方面积极向中央政府和社会各界求助,一方面制定相应的政策,加强对赈灾工作的管理和监督。另外严禁米粮出省,甚至暂时禁止酿酒,缓解省内
从农业文化类合肥方言词语的知晓及使用角度分析了合肥方言在青年和老年人群中的传承现状,表现为知晓及使用度上老年人普遍高于青年人,青年人知晓和使用度从高到低分别是与农
《徽州名人故居》一书通过名人故居的点点滴滴去探寻历史文化名人的生命之光,在捕捉他们当年成长的印迹、发现他们走向成功的奥秘的同时激发起后人对人生奋斗的激情。该书在
“强基计划”是提高我国基础学科创新人才质量的重要突破口。但从教育供给的角度来看,当前高校“强基计划”存在着供需错位、供给产品同质化、有效供给不足等现实困境,原因在
高校领导信箱是学校领导联系师生群众、收集意见建议的重要平台。通过梳理高校领导信箱的建设历程和发展阶段,分析信箱在改进管理方式、提升治理效能、深化作风建设、推进民
基于中国2010-2018年的省级面板数据,用保险、证券、银行区位熵衡量金融集聚程度,同时采用三种空间计量模型实证检验金融集聚对经济增长的空间溢出效应。基于偏微分法对最优
期刊
本文提出一种锥削函数同遗传算法相结合的阵面优化算法,该算法能够显著提高遗传算法优化效率,解决宽带平面波模拟器的多个工作频段优化问题。基于该算法设计了两种不同频段的宽带平面波模拟器,分别覆盖0.7~2 GHz和2~6 GHz频段。仿真结果显示,在700 MHz时,2.36m*2.36m(5.5λ*5.5λ)阵列口面可以形成1m*0.5m*1m高质量静区,该阵列工作频率范围可以达到0.7~2 GHz。