瞬时差分方法在中国象棋计算机博弈中的应用

来源 :河北大学 | 被引量 : 0次 | 上传用户：yangzhaodsg

【摘要】

：

与国际象棋相比较,中国象棋具有更大的棋子运动空间,并且中国象棋的着法更加特殊、棋局变化也更加复杂。在中国象棋计算机博弈中,对于设计一款优秀的博弈软件而言,最费时的就

【作者】

：

何玉林

【机构】

：

河北大学

【出处】

：

河北大学

【发表日期】

：

2009年期

【关键词】

：

中国象棋计算机博弈瞬时差分方法神经网络专家棋谱评价函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

与国际象棋相比较,中国象棋具有更大的棋子运动空间,并且中国象棋的着法更加特殊、棋局变化也更加复杂。在中国象棋计算机博弈中,对于设计一款优秀的博弈软件而言,最费时的就是评价函数的实现与调整。在本文中,我们使用三层的全连接前馈式神经网络表示评价函数,瞬时差分方法是一种增强学习算法,它利用相邻状态之间的状态值之差逐步地更新值函数的权值。基于单输出的神经网络,通过将TD(λ)算法引入到中国象棋计算机博弈中,我们推导出了套新的神经网络权值更新规则。我们使用专家棋谱作为训练样例,并利用新权值更新规则完成对网络的更新。在训练神经网络的过程中,每份专家棋谱被重复地学习,直至评价函数对专家棋谱中每个局面给出的评价值达到稳定。通过实验验证,我们学习到的评价函数是可行有效的。并且,我们获得了评价函数的表现与三种参数之间的关系：评价函数表现与神经网络隐含层节点个数之间的关系、评价函数表现与学习率α之间的关系、以及评价函数表现与参数λ之间的关系。

其他文献

煤矿监控系统实时数据与文件数据集成方法研究

煤炭企业信息化建设发展过程中不断面临各种挑战,将矿井信息系统、管理信息系统、生产自动化信息系统、网络管理系统高度集成并实现一体化控制和管理,是目前的发展趋势。本文

学位

数据集成数据捕获煤矿工控系统数据分析企业应用集成

一种应用级数据库入侵检测方法及其应用研究

数据库应用系统已经广泛运用于社会生活的各个方面,数据安全成为一个重要课题越来越受到人们的普遍关注。作为数据库应用系统的支撑平台,计算机网络、操作系统和数据库管理系

学位

数据库入侵检测模式匹配模糊轮廓树聚类

智能车载信息系统共享平台及安全机制的研究与实现

随着现代汽车工业和电子技术的快速发展,车载信息系统正在从简单的收音机向集成GPS导航、语音通信、多媒体娱乐、辅助驾驶、远程监控和故障诊断等复杂功能的智能系统方向发展

学位

车载信息系统信息共享平台权限管理安全机制权限提升

基于聚类分析算法的复杂网络绩效评估算法的研究与应用

绩效评估是人力资源管理中极其重要的一个方面。对于提高企业中员工的积极性和创造性，促进企业发展具有重要作用。20世纪80年代末，美国已经有大约90％以上的组织(包括企业及非营

学位

绩效评估复杂网络k-means算法文本聚类关联强度

嵌入式实时Hypervisor：XtratuM

本论文是作者对XtratuM Hypervisor进行学习和研究的工作总结,涵盖了作者为XtratuM Hypervisor所做的研究内容:中断管理、Hypercall、任务管理、虚拟内存管理等模块向不同Lin

学位

Hypervisor准虚拟化实时系统XtratuM

基于粒子系统的情感建模研究

人工情感建模在人机交互、教育、拟人机器人、娱乐等领域具有广泛的应用前景和经济价值,目益引起学术界和产业界的高度重视。很多大学和公司成立了人工情感研究组,如美国的麻

学位

人工情感粒子系统OCC模型

串空间模型及其认证测试方法的扩展与应用

安全协议提供安全服务,是构建网络安全的基石。随着网络的迅速发展,越来越多的密码技术被应用到安全协议中,保证了网络不同程度的安全性。然而各种针对协议的攻击技术也不断

学位

串空间模型认证测试方法密码学猜测攻击

概率数据库及有效查询技术的研究

在信息检索、传感器数据和图像识别等领域中,存在着大量不确定性的数据。当把这些数据存储到数据库时,要求数据库有对其进行处理的能力,而传统的数据库都是确定性的,不能对不

学位

概率数据库隶属函数模糊查询聚集函数

Java EE Web应用系统的结构及性能研究

Web应用是应用最广泛、最重要的计算机应用之一。基于Java EE的Web应用是实践较多，发展较迅速的一支。随着基于Java EE的Web应用的发展，很多框架被开发出来并应用。基于Java EE

学位

Java EEWeb应用系统运行性能

高校排课系统的研究

排课是高等院校教学管理中必不可少的常规工作,同时也是整个教学管理中最复杂、最繁重的工作之一。排课问题普遍存在于各类高等院校当中,无论其规模大小、学科多少,都要涉及

学位

排课系统PCA动态规划优先级广度优先回溯

瞬时差分方法在中国象棋计算机博弈中的应用

其他学术论文