基于价值的机器学习方法及其在RoboCup仿真2D中的应用

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:beichen35
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是当前涉及人工智能、机器人学、人工神经网络等学科的一个非常活跃的研究与应用课题,在工业、医疗、军事、体育等行业都具有很好的应用前景,将成为对社会发展产生深远影响的关键技术。机器学习的方法有很多,常见的学习算法有强化学习算法、人工神经网络算法、贝叶斯学习算法、决策树学习算法等。高效和快速训练出适应性较强的结果,是机器学习的重点和难点。出于对反应快、效率高、适应性好的考虑,本文提出了一种基于价值的学习方法并将此方法应用到了RoboCup2D平台中取得的很好的效果,主要的工作如下:(1)提出并解释了一种新的学习方法——基于价值的机器学习方法LBA(Learning based on Axiology)。LBA是根据人类价值观的思维方式被设计出来的,首先将世界模型(worldmodel)分为若干因素(factor)的组合,将这些因素与某种决策行为组合通过价值观修正函数产生出价值。然后通过价值的大小来取舍行为。(2)阐述了一种实用性很高的目标跟踪法——基于无关区域排除的目标跟踪EIA(Target Trace Algorithm based on Excluding Irrespective Area)。EIA是一种基于行为概率的目标跟踪。它定义了目标Agent的可信度(Agent Confidence)和区域可信度(Area Confidence)并通过比较两者的差异来更精确的对目标进行跟踪和定位。(3)把价值学习和无关区域目标跟踪结合应用到RoboCup2D中,设计并实现了出一个基于视觉的决策模型。经过大量的实验,从对场上动态物体的定位精度、传球成功率、决策行为匹配度和比赛成绩四个方面证明了该视觉决策模型的有效性。
其他文献
随着计算机技术的飞速发展,软件已广泛应用于各行各业,软件可靠性逐渐成为用户需求的重点。尤其在金融和航天领域,软件必须具有极高的可靠性,否则人们财产安全将受到严重威胁
随着互联网和宽带技术的发展,P2P的应用日益广泛,在享受P2P软件带来方便的同时,P2P的带宽资源占用问题日益凸显出来,已经严重的影响了校园网的正常运行和使用,P2P的业务监管
近年来,3D视频在电影娱乐以及日常生活应用中日益火热。3D视频其实是由多个相机分布在不同视角拍摄得到的,由于多个视点的纹理图和深度图需要巨大的空间去存储以及很高的带宽
随着信息时代的到来和经济全球化市场环境的形成,企业间的合作化程度越来越高,虚拟企业不断涌现,协同项目管理已逐渐成为各企业的一种有效的项目管理方式。同时,对协同项目管
疲劳驾驶已经成为引发交通事故的重要原因,对驾驶疲劳的检测是人机交互、计算机视觉等领域的重要研究内容。基于面部视频的疲劳状态分析与理解的目的就是要赋予计算机一定程度
流动层析成像技术是近年来飞速发展起来的一门新技术,该项技术在解决多相流检测问题上有巨大的发展潜力和广阔的工业应用前景。电阻层析成像技术以其成本低、适用范围广、结
软件测试作为保证软件质量的一种重要手段,在软件的生命周期中具有非常重要的地位。研究表明,越早发现软件中存在的问题,开发费用就越低,软件质量越高,软件发布后的维护费用
遥感图像分割是实现遥感图像理解关键的一步,是一个跨越图像处理、模式识别、计算机视觉、神经网络等多学科研究领域的综合性研究课题,有着广阔的应用前景,近年来受到人们普遍重视。由于遥感图像具有尺寸大、多波段、内容丰富多样、纹理特征丰富、多尺度等特征,使得遥感图像的分割比一般图像的分割难度更大。支持向量聚类方法是当前倍受关注的聚类分析方法,本文在认真研究了传统聚类分析方法和支持向量机理论的基础上,将支持向
本文对曲线造型中的能量极小约束问题进行了研究。曲线造型的能量极小约束方法在计算机辅助几何设计、计算机图形学、各类零部件加工等工程设计领域有着广泛的应用。一般认为
随着半导体技术、微系统技术、通信技术、计算机技术的飞速发展,无线传感器网络的应用范围越来越广,其研究已成为无线网络领域的重要课题。无线传感器网络有其自身的特点:节