两类搜索算法及在智能程序中的应用

来源 :北京师范大学 | 被引量 : 0次 | 上传用户：babyjoyce

【摘要】

：

本文围绕搜索算法在智能控制程序中的应用,进行了两项研究:智能控制Ms.Pac-Man游戏和智能控制Tetris游戏.同时本文还包括对一般符号序列的幂律现象和长程相关模型的研究,内容

【作者】

：

干晓聪

【机构】

：

北京师范大学

【出处】

：

北京师范大学

【发表日期】

：

2012年期

【关键词】

：

搜索算法智能控制程序 Ms.Pac-Man游戏 Tetris游戏空间划分法最近邻组合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文围绕搜索算法在智能控制程序中的应用,进行了两项研究:智能控制Ms.Pac-Man游戏和智能控制Tetris游戏.同时本文还包括对一般符号序列的幂律现象和长程相关模型的研究,内容提要如下:　　使用实时搜索算法智能控制非确定性游戏Ms.Pac-Man.提出使用Corner Pixel的方法来快速进行图像识别,能以较快的速度和较高的准确率满足实时性的要求.提出了高效的启发式规则,使得搜索树能在有限时间内达到需要的深度.　　使用演化算法智能控制Tetris游戏.提出了两种新的演化搜索算法:空间划分法和最近邻组合方法.使用特殊的输入序列,并对估值算法进行了优化,大大缩短了演化估值的时间.　　对一般符号序列,研究了子序列幂律现象,提出了子序列偏好增长模型.总结了两类长程相关模型,给出了产生长程相关序列的条件.分析了DFA图中的分段现象,并给出了出现分段现象的条件.　　本文具体包括了如下部分的内容:　　第一章给出了搜索算法的介绍,重点讲述了NFL(No Free Lunch)定理,给出了对此定理的一个新的证明,并讨论了NFL定理对于搜索算法的指导作用:搜索空间的优解聚集性是搜索算法有效的前提条件.然后介绍了状态空间搜索算法.状态空间搜索指在状态空间中寻找从初始状态到目标状态的最优路径问题,一般是最短路问题.通过介绍可采纳性和上下界,给出了状态空间搜索算法的一般框架.　　第二章和第三章详细介绍了Slide Puzzle问题和Rubik’s Cube两个经典的状态空间搜索问题,具体包括部分状态的不可达性、对已有启发式的综述介绍、对称性的使用、通过下界求最短路和通过上界求连通图直径.目前国内关于这方面的介绍很少,希望这部分内容能对读者有所裨益.　　第四章是实时状态空间搜索算法在智能控制Ms.Pac-Man游戏中的应用.首先详细综述了前人的方法与结果.我们将游戏迷宫描述为网络,游戏中的个体用网络中的位置和运动方向来描述,这些合起来作为游戏的状态.提出了Corner Pixel的方法来快速进行游戏中的图像识别,结果表明,这个方法能以较快的速度和较高的准确率满足实时性的要求.然后使用状态空间的搜索算法评估各种走法,评估结果作为决策参数,以决定最优的走法.由于游戏的非确定性和实时性,搜索算法只需也只能搜索较小的一个深度.由于游戏的复杂性,搜索算法不能独自提供最终决策,而只是提供参数,这些参数再经过人工指定的规则形成最终决策.最终的结果表明,我们的方法效果显著好于已有的其它方法.　　第五章介绍了解空间搜索算法.解空间搜索指在参数空间中寻优问题.介绍了演化策略、遗传算法和交叉熵方法,并从优解的聚集性角度,给出了这些算法为何有效的直观说明.在优解聚集的基础上,我们提出了两种新的演化搜索算法:空间划分法和最近邻组合方法.空间划分法基于“产出/投入”的思想,在优解附近的空间重点搜索;最近邻组合方法则通过对已有优解的线性组合,完成在优解附近的空间重点搜索.　　第六章是解空间搜索算法在智能控制Tetris游戏中的应用.首先介绍了Tetris游戏及其必输的理论.然后介绍了自动控制Tetris游戏的一般方法:演化权重法,包括特征选择和演化方法,并介绍了前人已有的结果.然后介绍了自动控制Tetris游戏的困难性:对一个算法,或者说一组参数,估值的计算时间过长,结果的巨大波动性以及随之而来的过拟合问题.通过对估值算法的仔细分析,我们仔细优化了相关的算法,并使用特殊分布的积木序列来大大加速估值过程.通过使用训练集和测试集,加速了估值速度,并一定程度上减少了过拟合的影响.初步的结果表明,我们的方法能显著减少训练时间并得到更好的训练结果.　　第七章和第八章是关于一般序列的子序列幂律和长程相关模型.自然界和人类社会中的大量现象可以归结为符号序列和数字序列,幂律和长程相关是两个重要研究方向.子序列幂律是对传统幂律的推广,在DNA、语言、计算机程序甚至音乐中广泛存在.我们对包括完整的人类DNA在内的海量数据进行实证分析;提出子序列偏好增长模型,并进行理论分析推导.在长程相关模型方面,我们总结出两类通用的机制:逆傅立叶变换法和分段模型.在此基础上,讨论各个模型对应的段长分布,并对实际数据进行实证.最后讨论重复和长程相关的关系.　　

其他文献

特高压直流输电接地极计算及评估软件开发

高压直流输电单极大地回线方式运行时,强大的直流电流持续地、长时间经过接地极注入大地,导致大地电位升高,出现跨步电压和接触电势等电磁效应,对金属管道、铠装电缆、电力系统和极址附近的人畜产生负面影响,因此对接地极的设计和埋设要求非常复杂,需要事先对接地极相应的电气参数进行计算。论文利用镜象法和等效法建立了接地电阻和接地极电位计算模型；推导了接地极地面跨步电压和接地变压器中性点直流电流计算公式；以Vis

学位

接地极接地电阻地面电位跨步电压软件开发

月季芬芳惠百姓

喜爱月季花的人惜花赏花又护花,真切的心情不仅反应在情绪上,还表现在日常生活的行动中,月季花既然名为月月红,我们就按顺序把这些偏好编出来,凑出12个月季花谱来也是很有趣

期刊

月季月季花谱月季花月月红惜花爱花我家偏好市花顺序

桌面型地铁驾驶仿真系统的研究

随着城市轨道交通运行线路的快速发展，地铁公司每年都需要培训大量的列车司机，如何快速，高效，安全的培训这些新司机，让这些司机达到上岗标准，是摆在培训部门面前的重要课题。由于需

学位

一类混杂系统的控制器设计

随着工业控制对象的规模日益趋于复杂,对控制精度的要求也日益提高,工业控制过程中的连续过程系统(CVS)和离散事件动态系统(DEDS)的耦合关系越发突出,连续和离散过程之间的耦

学位

分段仿射系统稳定性线性矩阵不等式不确定性无源性

《大地构造与成矿学》2014年（第38卷）第1期要目

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

Ferroelectricity and multiferroicity: Broader way to go beyond

本文通过对荣华二采区10

期刊

condensed matter physicsfunctional materialsatomic levelsmall world

基于EPMM的软件过程度量模型的研究

软件度量是软件工程的一个活跃的研究领域。随着软件开发过程的规模和复杂度越来越大,对软件过程度量的重视程度也越来越高。软件过程度量是过程评估和过程改进的基础,而软件

学位

软件演化过程过程度量模型时间代价随机Petri网马尔科夫

稽查信息系统的研究与实现

该文章阐述了系统建模在信息系统开发中的作用和重要性,运用传统的建模技术对系统进行分析和描述.信息系统就是一个现实世界里系统的代表,系统建模是系统实施前对实际系统的

学位

信息系统系统建模选案模型网络规划稽查

基于B/S模式配网设备信息管理系统的研发

配电网是电力系统的重要组成部分，配电网的安全稳定运行对我国国民经济发展起着至关重要的作用。随着我国社会经济高速的发展，电力系统容量和用户数量不断增加，大量的新型设备不

学位

管理系统B/S模式配电自动化配网设备

主从微分博弈、自适应博弈以及博弈思想在化工领域中的应用

博弈论是相对年轻的科学，迄今才70余岁，自诞生之日起，博弈论在理论和应用上都取得了巨大的进展。在理论上，现有的博弈论研究的往往是参与者地位平等以及博弈的结构与参数对参与者

学位

复杂系统多目标优化权重优化微分博弈

两类搜索算法及在智能程序中的应用

与本文相关的学术论文