自组织映射神经网络量化机器人强化学习方法研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:jerryhua1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习一词来自于行为心理学,这门学科把行为学习看成反复试验的过程,从而把环境状态映射成相应的动作。在设计智能机器人过程中,如何来实现行为主义的思想,在与环境的交互中学习行为动作?文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为,采用强化学习方法来实现智能机器人避碰行为学习。为了提高机器人学习速度,在机器人局部路径规划中的状态空量化就显得十分重要。本文采用自组织映射网络的方法来进行空间的量化。由于自组织映射网络本身所具有的自组织特性,使得它在进行空间量化时就能够较好地解决适应性灵活性问题,本文在
其他文献
软件进化已成为软件领域近期的研究热点之一.本文将开放实现与反射技术与软件进化结合起来,提出了软件运行进化的概念,并分析了开放实现与反射技术与软件进化六元组的关系,提
小型农田水利工程是保证农业生产良好发展所不可缺少的必要条件及设施,是保证粮食作物及其它农作物良好生长的物质基础。小型农田水利工程,是实现作物增产、农业增效、农民增
组播的密钥分配不同于传统的单播密钥分配,尤其是对于大型动态组其密钥分配更加复杂.本文讨论了适用于大型动态组的两种密钥分配方案即逻辑密钥层次LKH(Logical Key Hierarch
依据多媒体时间模型和同步模型,面向对象的并发系统和分布式系统的研究已经取得不少结果.但由于特殊的要求,这些结果已不能满足实际应用的需要,为此,我们就分布式多媒体系统中的
根据移动网络的特性并结合其管理方式,提出了一种新的基于移动网络并具有一定QoS保证的网络重组策略,将引入的重新划分网络边界和周界的思想,与启用备用链路,重路由等几种机制有
从建筑可持续设计的角度找到BIM技术和可持续设计的共同点,分析BIM技术应用于可持续设计面临的主要问题和挑战。最后,得出一些有用的结论。
结合实际,针对如何解决钢筋工程的质量问题进行了论述。
本文应用带盘的Bayes网络作为分析模型,对于学习实例数据库为分组样本的关于各组样本私有条件概率的学习算法进行讨论,构建出两层学习结构:第一层针对各组私有条件概率分布Θ
随着社会经济的发展,农业灌区的改造和新建都在飞速发展,在灌区的水利工程规划管理很重要。灌区水利工程建设对我国农业发展起着重要的作用,缓解了我国水资源匮乏的压力,为粮
排水管在建筑中是不可或缺的存在,近些年为了提高排水管的使用年限,绿色耐腐蚀混凝土排水管在建筑中应用广泛,管芯振动成型技术作为绿色耐腐蚀混凝土排水管的主要应用技术,在