切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于强化学习TD算法的乒乓游戏击球策略优化
基于强化学习TD算法的乒乓游戏击球策略优化
来源 :电脑知识与技术:学术交流 | 被引量 : 0次 | 上传用户:lanrengbuluo
【摘 要】
:
计算机乒乓游戏是出现在个人计算机上最早的游戏之一,该文利用强化学习中的TD算法,将状态的变化与得分的统计规律统计出来,就是研究在当前状态S下,球拍怎样移动获利最大,让机器击
【作 者】
:
陈功
周谊成
王辉
【机 构】
:
苏州大学计算机科学与技术学院
【出 处】
:
电脑知识与技术:学术交流
【发表日期】
:
2011年10期
【关键词】
:
机器学习
TD算法
策略优化
reinforcement learning
TD algorithm
strategy optimization
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机乒乓游戏是出现在个人计算机上最早的游戏之一,该文利用强化学习中的TD算法,将状态的变化与得分的统计规律统计出来,就是研究在当前状态S下,球拍怎样移动获利最大,让机器击球手快速运动并准确击球。
其他文献
基于中间应答的分段式扩展环搜索算法
广播是无线多跳网络的基本操作,针对现有广播算法大多存在转发冗余度高、广播开销大的问题,提出一种分段式扩展环搜索算法S-ERS。该算法从数据分组中提取距离信息,在此基础上
期刊
无线多跳网络
广播
扩展环搜索
广播开销
multi-hop networks broadcast expanding ring search broadcas
基于用例点进行软件估算
目前用例模型作为一种捕捉和分析软件功能性需求的方法已经被广泛采用。用例点估算方法正是以用例模型为基础的一种软件估算方法,该方法被证实是一种易操作、实用、可靠的估
期刊
UCP
用例点
软件估算
UCP
use case points
software estimation
电子商务环境下新型信任管理模型
电子商务活动在开放网络环境中越来越频繁,文件共享等服务也越来越普遍,用户之间的信任关系成为安全问题的重点。该文研究了现有的推荐信任模型,分析了其中存在的问题,提出了
期刊
信任
信任管理模型
贝叶斯网络
trust
trust management model
bayesian network
探讨DHCP环境下防范非法DHCP服务器的措施
在使用DHCP服务的网络中,非法DHCP服务器的存在将干扰合法DHCP服务器的正常工作,从而影响网络的正常运行。该文给出了DHCP服务的工作过程,分析了非法DHCP服务器可能带来的危
期刊
DHCP服务器
防范措施
非法DHCP服务器
DHDP server
precautionary measures
Illegal DHCP Servers
开展安全性评价工作成绩斐然
江西省电力公司于1998年对所属的发供电企业认真地开展了安全性评价工作,取得了一定的成绩。通过安全性评价工作,提高了企业职工的整体素质,促进了安全管理工作,逐步地标准化,规范化,使
期刊
安全评价
电力公司
江西
安全管理
羟基氧化铁和活性炭催化异丙醇还原芳香族硝基化合物制备芳胺
将NaOH溶液快速滴加至Fe(NO3)3·9H2O和聚乙二醇(PEG)1 000的混合物中,制备了羟基氧化铁.用X-射线粉末衍射仪(XRD)、傅里叶交换红外光谱仪(FTIR)和激光粒度仪对制备的羟基氧化铁
期刊
羟基氧化铁
异丙醇
芳香族硝基化合物
还原
iron oxyhydroxide propan-2-ol aromatic nitro compounds red
UML在图书馆短信催还系统中的应用
为有效提高高校图书馆的服务质量,提出了以短信方式为读者提供服务的服务理念。以图书馆短信催还系统的分析、设计为背景,探讨了UML在系统建模中的应用。以用例图表达系统需
期刊
用例
UML
短信
催还系统
Use Case
UML
SMS
return system
葛洲坝人在三峡工地“9.3”重大伤亡事故发生之后——振奋精神 防微杜渐 确保施
期刊
三峡工程
工地
伤亡事故
事故处理
安全检查
无线传感器网络安全分析
无线传感器网络由具有感知、计算和通信能力的无线传感器节点组成。为了发展无线传感器网络的安全应用,对无线传感器网络的安全攻击和防御进行了分析,针对主要的问题,提出了
期刊
无线传感器网络
网络安全
攻击
防御
WSN
network security
attack
defense
一种基于数据挖掘的HIFU温度估计方法
摘要:高强度聚焦超声(HIFU)是一种无创、低费用的新型肿瘤治疗手段。但是目前仍无一种有效的HIFU无损温度监控及检测治疗方法可应用于临床。该文采用数据挖掘中的回归分析模型,挖
期刊
数据挖掘
HIFU无损温度估计
主成分分析
data mining
HIFU non-invasive temperature monitor
princi
与本文相关的学术论文