面向人机交互的强化学习与意图推理

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:treef620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
赋予智能系统以强大的学习能力以及丰富的人机交互功能是智能系统在动态不确定环境中完成复杂任务的必由之路。在实际的交互过程中,要想完成智能体与人类用户的自然有效的交互,又需要对人类的意图进行正确的推断和识别。如何建立一个融合强化学习和用户意图推理的学习体系来实现智能系统的高级交互智能,进而应用于复杂的人机交互任务,具有重要的学术价值和实际意义。本文以智能机器人在实际的动态复杂环境中完成人机交互任务为背景,针对交互任务中如何对人的意图进行有效的识别,进而用以提升强化学习算法的适应能力和收敛速度,从强化学习和意图推理两个方面进行了相关研究,设计并提出了面向人机交互的强化学习和意图推理算法,并通过人机交互实验验证了算法的有效性。本文的工作主要包括:1)设计了基于粒子滤波和强化学习的目标跟踪控制框架,以在动态不确定环境下对目标人进行跟踪针对现有的机器人跟随控制算法不能适应动态变化环境的特点,设计提出了一种基于视觉传感的机器人跟踪控制框架,将粒子滤波算法与强化学习算法相结合,使得之能够完成在动态不确定环境下对目标人进行有效跟踪的任务。2)提出了基于灰色预测的意图推理算法,实现对人行走意图的预测,以提升跟踪算法对人运动变化的适应能力由于现有的跟踪控制算法没有考虑人的行走规律,因而使机器人在完成跟随任务时存在一定的迟滞,且难以适应人在行走方向和速度上的变化。本文提出了一种基于灰色预测新陈代谢GM(1,1)模型的用户意图推理算法,对人的行走意图进行建模,并用以对机器人的控制量进行修正,从而提升了机器人跟随的适应能力。3)设计了基于贪婪指导的快速交互式强化学习算法,以实现对人指导信息的充分有效利用,加速强化学习算法的收敛为了使机器人充分利用人交互过程中人给出的指导信息,在任务空间中进行更有效的搜索,本文提出了一种基于贪婪指导的快速交互式强化学习算法,从尽可能少的指导信息中挖掘出尽可能多的有效信息,加快了算法的收敛速度,减少了人的参与度和工作量。4)提出了一种基于意图推理的交互式强化学习算法,在人出现偶然错误的情况下对其真实意图进行有效识别,避免了对学习过程的误导在人机交互的过程中由于各种原因导致人给出的信息会有一定概率出错。在此基础上,本文提出了两种意图建模算法,即人的奖惩意图建模和指导意图建模,并将其与基于贪婪指导的快速交互式强化学习算法相结合,设计了基于意图推理的交互式强化学习算法。对比实验证明了该算法能够在人偶然出错的情况下,仍然能够对人的真实意图进行有效的识别,从而避免了对学习任务的干扰和误导,使机器人仍能快速地完成学习任务。
其他文献
随着经济的全面发展和社会的不断进步,消费者对产品的标识、防伪等技术提出了新的需求。目前国内市场上绝大多数喷码机是以单片机为驱动器、连接PC机组成的系统,存在着喷印效
为适应长江中游航道整治工程的需求,满足航道整治中在软基础河床上构筑整治建筑物的建设要求,长江航道局决定开发建设用于铺设软体沙枕或混泥砼联锁块排布进行护底作业的铺排
随着现代科学技术的发展,智能建筑已成为目前世界建筑发展的趋势。而在我国智能建筑仍处在起步阶段,进一步研究和探索智能建筑的发展,对于我们来说是十分必要的。由于各方面
电机的定位不同于启动和调速控制,是伺服控制的一种特殊运动形式,要求有很高的定位精度和动态的响应性能。大惯性负载应用比较广泛,比如日常生活、工业、建筑、航空航天、军工等领域。由于大惯性负载具有较大的转动惯量,因此带有大惯性负载的运动系统响应有严重的滞后特性,导致在实际应用中实时控制被控对象的准确位置比较困难,对于定位时间和精度较高的场合是个难点。本文分析了滑模控制(SMC)理论,各种滑模面和趋近律优
随着计算机和通信技术的进步,数字图像通信已经成为一个发展的趋势,自从ISO/IEC制定的MPEG-2成为实际的多媒体工业标准后,方方面面的视频音频产品如雨后春笋般的发展起来,而
大脑电生理信号是反映大脑活动状态的重要信号,主要包括自发脑电信号(EEG)和诱发脑电信号(EP)。如何有效地处理和分析脑电信号,对于脑科学研究和脑部疾病的临床诊断都具有重
矿产资源是社会发展的重要物质基础,而绝大多数矿产资源属于不可再生的耗竭性资源。矿业是开采矿产资源的行业,是国民经济的一个重要组成部分,在经济建设和人民生活中有着十
精密自动定位技术是现代精密制造业领域里的一项基础性支撑技术,在许多高科技产业里有着广泛的应用需求,是国际科技界重点研究的一项高新技术。国外对精密定位的研究起步早起
随着能源紧缺和环境污染问题愈加严重,光伏发电因其清洁、灵活、可再生的特点,得到了和深入研究和广泛应用。而随着电网技术的发展和用户对电能质量要求的不断提高,多电平变流技
在计算机、互联网和通信技术高速发展的同时,嵌入式系统开发技术也得到迅速发展,由于嵌入式系统具有体积小、功耗低、性能强、可靠性高,以及面向行业应用的突出特点,目前已经广泛