【摘 要】
:
与国际象棋相比较,中国象棋具有更大的棋子运动空间,并且中国象棋的着法更加特殊、棋局变化也更加复杂。在中国象棋计算机博弈中,对于设计一款优秀的博弈软件而言,最费时的就
论文部分内容阅读
与国际象棋相比较,中国象棋具有更大的棋子运动空间,并且中国象棋的着法更加特殊、棋局变化也更加复杂。在中国象棋计算机博弈中,对于设计一款优秀的博弈软件而言,最费时的就是评价函数的实现与调整。在本文中,我们使用三层的全连接前馈式神经网络表示评价函数,瞬时差分方法是一种增强学习算法,它利用相邻状态之间的状态值之差逐步地更新值函数的权值。基于单输出的神经网络,通过将TD(λ)算法引入到中国象棋计算机博弈中,我们推导出了套新的神经网络权值更新规则。我们使用专家棋谱作为训练样例,并利用新权值更新规则完成对网络的更新。在训练神经网络的过程中,每份专家棋谱被重复地学习,直至评价函数对专家棋谱中每个局面给出的评价值达到稳定。通过实验验证,我们学习到的评价函数是可行有效的。并且,我们获得了评价函数的表现与三种参数之间的关系:评价函数表现与神经网络隐含层节点个数之间的关系、评价函数表现与学习率α之间的关系、以及评价函数表现与参数λ之间的关系。
其他文献
煤炭企业信息化建设发展过程中不断面临各种挑战,将矿井信息系统、管理信息系统、生产自动化信息系统、网络管理系统高度集成并实现一体化控制和管理,是目前的发展趋势。本文
数据库应用系统已经广泛运用于社会生活的各个方面,数据安全成为一个重要课题越来越受到人们的普遍关注。作为数据库应用系统的支撑平台,计算机网络、操作系统和数据库管理系
随着现代汽车工业和电子技术的快速发展,车载信息系统正在从简单的收音机向集成GPS导航、语音通信、多媒体娱乐、辅助驾驶、远程监控和故障诊断等复杂功能的智能系统方向发展
绩效评估是人力资源管理中极其重要的一个方面。对于提高企业中员工的积极性和创造性,促进企业发展具有重要作用。20世纪80年代末,美国已经有大约90%以上的组织(包括企业及非营
本论文是作者对XtratuM Hypervisor进行学习和研究的工作总结,涵盖了作者为XtratuM Hypervisor所做的研究内容:中断管理、Hypercall、任务管理、虚拟内存管理等模块向不同Lin
人工情感建模在人机交互、教育、拟人机器人、娱乐等领域具有广泛的应用前景和经济价值,目益引起学术界和产业界的高度重视。很多大学和公司成立了人工情感研究组,如美国的麻
安全协议提供安全服务,是构建网络安全的基石。随着网络的迅速发展,越来越多的密码技术被应用到安全协议中,保证了网络不同程度的安全性。然而各种针对协议的攻击技术也不断
在信息检索、传感器数据和图像识别等领域中,存在着大量不确定性的数据。当把这些数据存储到数据库时,要求数据库有对其进行处理的能力,而传统的数据库都是确定性的,不能对不
Web应用是应用最广泛、最重要的计算机应用之一。基于Java EE的Web应用是实践较多,发展较迅速的一支。随着基于Java EE的Web应用的发展,很多框架被开发出来并应用。基于Java EE
排课是高等院校教学管理中必不可少的常规工作,同时也是整个教学管理中最复杂、最繁重的工作之一。排课问题普遍存在于各类高等院校当中,无论其规模大小、学科多少,都要涉及