切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于拓扑序列更新的值迭代算法
基于拓扑序列更新的值迭代算法
来源 :通信学报 | 被引量 : 4次 | 上传用户:yvonnechan
【摘 要】
:
提出一种基于拓扑序列更新的值迭代算法,利用状态之间的迁移关联信息,将任务模型的有向图分解为一系列规模较小的强连通分量,并依据拓扑序列对强连通分量进行更新。在经典规划问题Mountain Car和迷宫实验中的结果表明,算法的收敛速度更快,精度更高,且对状态空间的增长有较强的顽健性。
【作 者】
:
黄蔚
刘全
孙洪坤
傅启明
周小科
【机 构】
:
苏州大学计算机科学与技术学院,吉林大学符号计算与知识工程教育部重点实验室
【出 处】
:
通信学报
【发表日期】
:
2014年08期
【关键词】
:
强化学习
值迭代
拓扑序列
VI-TS
reinforcement learning value iteration topological sequence
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于拓扑序列更新的值迭代算法,利用状态之间的迁移关联信息,将任务模型的有向图分解为一系列规模较小的强连通分量,并依据拓扑序列对强连通分量进行更新。在经典规划问题Mountain Car和迷宫实验中的结果表明,算法的收敛速度更快,精度更高,且对状态空间的增长有较强的顽健性。
其他文献
安全两方线段求交协议及其在保护隐私凸包交集中的应用
研究了现有安全多方计算几何协议,提出了安全多方计算几何的模型和框架,从数学模型、安全模型和通信模型3个维度展开描述。针对现有安全两方线段关系判定协议都忽略求解交点坐标的问题,在半诚实模型下基于Paillier同态加密技术提出了安全两方线段求交协议,使用Goldreich证明法进行了理论安全性分析,并在恶意模型下进行了推广。分析结果表明,该半诚实模型下的算法在效率上优于现有算法。作为安全两方线段求交
期刊
密码学
安全多方计算几何
安全两方线段求交
保护隐私
凸包交集
cryptography secure multi-party computational ge
Zr基大块非晶合金低速切削性能试验研究
为研究大块非晶合金Zr41.2Ti13.8Cu12.5Ni10.0Be22.5的切削性能,通过使用扫描电镜对加工后合金表面和切屑形貌进行分析。结果表明:切削速度越低、切削深度越小,工件表面粗糙度
期刊
大块非晶合金
切削
切屑
bulk amorphous alloy cutting chip
园林绿化工程中提高大树移植养护管理水平的措施
随着我国社会的不断发展和人们生活水平的不断提高,人们的环境保护意识不断增强,园林绿化工程已成为城市建设发展中一项重要内容。在园林绿化工程中,大树移植是一项经常运用
期刊
园林绿化工程
大树移植
养护管理
Android智能终端安全综述
针对Android智能终端安全问题,构建Android智能终端安全分层体系。首先从远程防盗、生物身份验证和硬件安全模块方面阐述了Android设备安全的安全威胁及保护措施,然后从无线
期刊
Android
设备安全
网络安全
系统安全
应用安全
数据安全
严寒地区粘贴EPS板外墙外保温薄抹灰面层施工质量控制
针对严寒地区粘EPS板外墙外保温薄抹灰系统应用以来出现的质量问题,提出材料控制、基层控制、粘贴控制、锚栓加设、系统终端控制、面层及滴水线控制、嵌缝胶施工等质量控制措
期刊
寒地建筑
外墙外保温
EPS板
buildings in cold region exterior thermal insulation of external
认知无线电系统中干扰对齐的自由度分析
在信号空间维度有限的情况下,大部分认知无线电系统(主用户个数大于1)中干扰对齐的可行性条件是不明确的。针对这一问题,把有多个主用户和多个次用户的认知系统中的干扰对齐问
期刊
认知系统
干扰对齐
可行性条件
自由度
CR system
interference alignment
feasibility conditions
d
真空挤压铸造工艺与装置
本文介绍一种压铸技术,该技术已于2001年由国家专利局授予了发明专利.这套技术,涉及真空压铸工艺的改进与相配套的装置及其模具.……
期刊
紫菜育苗环境参数智能化控制设计与试验
本文对紫菜育苗环境参数智能化控制进行总体方案设计,针对数据采集部分、控制器主体设计和元器件选型进行硬件设计,针对控制系统的软件进行设计并组装和试验,根据试验结果对
期刊
紫菜育苗
环境参数
硬件设计
软件设计
YBM251车削TC4钛合金切削力与刀具磨损的试验分析
进行了硬质合金涂层刀具YBM251在不同切削速度下车削TC4钛合金的试验,通过KISTLER测力仪9257B测量切削力数据,使用VHX-1000电子显微镜观察刀具磨损.通过MATLAB对切削力信号进
期刊
刀具磨损
切削力
斜率
涂层硬质合金
tool wearcutting forceslopecoated carbide
知识系统设计及其在压铸模智能CAD中的应用
将面向对象的知识表达方法应用于压铸模具的智能CAD系统中.将设计对象的属性、处理过程、启发性知识统一表示在对象结构中.模具设计的领域知识通过多重继承来实现.在知识系统
期刊
面向对象
知识表示
压铸模
智能CAD
其他学术论文