基于深度强化学习的智能学伴机器人设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:nkxrb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,教育模式迎来新的改革契机,为满足学生群体不断增长的自主学习需求,在线教育应运而生,并成为不可或缺的教育方式,各类在线教育平台不断涌现,其中由西安电子科技大学计算机科学与技术学院研发的智慧教育平台旨在为学生提供优良的在线学习环境,在师生中引起强烈反响,通过前期多维度数据分析发现,学生成绩与其平台表现呈很强的相关性,因此提升学生对于智慧教育平台的使用积极性极为必要。深度强化学习(Deep Reinforcement Learning,DRL)是人工智能领域研究的重要组成部分,在诸多领域尤其是游戏方面取得了巨大成功,其超强的游戏能力引人关注。在此背景下,依托智慧教育平台,基于深度强化学习打造智能学伴机器人系统的游戏模式,旨在从提升趣味性的角度出发,通过游戏模式增强学生在智慧教育平台自主学习的兴趣与热情,达到优化教学的目的。开展的具体工作内容如下:(1)通过对国内外在线教育及深度强化学习的发展现状调研,探讨在线教育平台对学生缺乏吸引力的问题,分析在线教育引入游戏模式的有效性,提出智能学伴机器人系统游戏模式的总体设计,构建基于深度强化学习的Agent(智能体),为每位学生的专属智能学伴机器人提供游戏能力。依据学生学习积分折算训练步数自动训练对应Agent,使其游戏能力成为学生在智慧教育平台学习量的直观体现,进而通过比赛模式提升学生对其专属智能学伴机器人的拥有感,促使学生为获得比赛胜利而进行更多学习活动。(2)智能学伴机器人系统游戏模式分为两个主要功能模块:训练模块、比赛模块。训练模块核心功能是由学生学习积分驱动基于DQN或A3C算法的Agent自主训练,逐步提升其游戏能力,游戏得分即代表了学生在智慧教育平台的学习表现。为了进一步增加游戏趣味性,激发学生兴趣,经过训练的Agent能够参与网页游戏多人比赛,并分出胜负,模拟智能学伴机器人同场对战的效果,即比赛模块核心功能。网页游戏中不同个体的动作完全受到动作指令的控制,Agent根据动态的游戏环境向游戏中不同个体发出动作指令进行实时操控,即探索一种深度强化学习在网页游戏多人实时比赛中的应用方式。智能学伴机器人系统解决实时通讯和网页游戏多人比赛异步等问题,符合智慧教育平台实际应用需求,为更多类似的应用场景提供了可靠的理论与实践基础。
其他文献
随着科学出版物的数量在不断增加,理解一篇科学论文可能需要很长时间,这对人们可以阅读的论文数量提出了很大的挑战。随着近些年来人工智能技术的越来越被重视,知识图谱技术也经常被其他领域所使用,利用知识图谱中实体与实体之间的关联,通过图的剪枝,将知识图谱的图形知识结构转变成一个具有层次体系的树形结构,在树形结构上依靠统计科学知识挖掘隐藏信息,找到存在与树上的技术热点,通过这样可以帮助科研工作者,迅速了解某
1.引入碳纳米管,采用液相沉淀法将碳纳米管与金属甲酸框架化合物相复合,所得复合物[CH3NH3][Co(HCOO)3]/CNTs作为前驱体,将其经低温气-固磷化后可得CNTs穿插Co P/Co P2的复合电催化剂(Co P/Co P2/CNTs),并通过控制实验条件制得无CNTs的Co P和Co P/Co P2,并对系列材料进行形貌、物相和电催化性能表征。电化学测试结果表明,Co P/Co P2/
学位
学位
随着农业现代化的脚步加快,具有自主作业能力的农业机械(以下简称农机)发展前景十分广阔。目前对农机的主从协同控制方法的研究不断创新,主要对主机与从机的横向偏差进行控制,即控制从机,对主机作业路径进行跟踪,使从机与主机的路径之间的横向位置偏差的精度保持在一定范围之内。本文的研究对象主机为收割机,从机为运粮车(拖拉机),由于收割机-运粮车主从协同控制方法决定着主从协同导航控制系统的控制性能优劣,因此对收
裂隙作为岩体中的软弱裂隙面,是控制岩体力学特征的最重要因素。准确地把握、描述岩体中的裂隙网络是建立可靠岩体力学模型的基础。因岩体中裂隙普遍发育,裂隙数量众多,故无法对每一条裂隙进行定量描述。采用Monte Carlo随机模拟方法建立三维裂隙网络模型,有利于直观了解岩体内部分布规律,掌握一般情况下难以观察、测量到的岩体内部结构特征。因此三维裂隙网络广泛应用于岩体力学领域,极大促进了岩体力学的发展。本
疲劳驾驶检测技术在道路安全方面起着至关重要的作用。国内外众多学者针对基于驾驶员生理信号、面部特征、汽车运动信息等多种疲劳检测技术都进行了深入研究,每种疲劳检测方法都有其自身缺陷例如侵入性测试、误检测、漏检测等。基于多源信息融合的疲劳检测方法因其能平衡互补多种疲劳检测方法来提高系统疲劳检测准确率而逐渐引起人们的关注,考虑到驾驶疲劳是驾驶人员产生疲劳状态进而影响到车辆行驶的过程,本文提出基于驾驶员脑电
近年来,区块链技术的相关研究成为了国内外前沿科技研究热点,特别是作为区块链底层关键技术之一的共识算法,它是保障区块链上节点就区块链状态达成一致的重要环节。但共识算法在吞吐量、时间延迟、动态性等方面存在的问题日益凸显,影响了区块链的发展。因此,本文在分析现有区块链共识算法的基础上进行了基于动态信誉的区块链共识算法研究。主要研究工作包括:首先,本工作详细的对实用拜占庭共识算法PBFT(Practica
单晶硅片是集成电路产业最重要的衬底材料,近95%的集成电路芯片都在硅衬底上制造,为了满足封装技术对硅片厚度的要求,硅片在加工过程中不仅需要高效率的去除加工余量,同时还要求硅片具有较高的表面/亚表面质量。本文以提高硅片加工效率和降低硅片表面/亚表面损伤为主要目标,采用金刚石砂轮磨削与机械化学磨削技术相集成的单晶硅加工工艺,深入研究了不同粒度金刚石砂轮的磨削性能;设计了一款湿式机械化学磨削专用砂轮,并
贝塞尔-高斯光束(Bessel-Gaussian Beam,BGB)具有一般涡旋光束没有的特点,它具有一定的无衍射和自愈特性,且相比于激光束、高斯光束等具有更好的抗湍流能力,是传输理论中的最佳代表光束之一。其在无线光通信领域具有重要的应用价值,可以作为“光学扳手”,也可以在细胞操控治疗、图像处理以及信息保密等领域中进行广泛的应用。论文主要对贝塞尔-高斯光束在大气湍流中的传输特性进行了详细的分析。具