搜索筛选:
搜索耗时0.5299秒,为你在为你在102,267,441篇论文里面共找到 10 篇相符的论文内容
类      型:
[会议论文] 作者:袁姣红,吴敏, 来源:湖南省第三届研究生创新论坛——信息与控制工程的新理论和新技术分论坛 年份:2010
为解决大规模强化学习中的“维度灾难”问题, 克服以往学习算法的性能高度依赖于先验知识或者探测程度的局限性,本文提出一种未知环境中基于概率模型的动态分层强化学习方法。...
[会议论文] 作者:郭晓辉,王红兵, 来源:第一届全国服务计算学术会议 年份:2010
动态Web服务组合近年来作为一个极具挑战性的问题正吸引着越来越多的人的关注.但是,目前主流的动态服务组合方法在面对大规模服务组合时都存在着效率不高等问题。本文提出一种......
[会议论文] 作者:张晓艳[1]唐昊[2]韩江洪[2]周雷[1], 来源:第29届中国控制会议 年份:2010
传统用于解决多Agent系统的分层强化学习(Hierachical Reinforcement Learning,HRL),基本上是建立在离散时间多Agent半马尔科夫决策过程(Discrete Time...
[会议论文] 作者:王丽君, 来源:甘肃省档案学会 年份:2010
通过学习先进人物的崇高精神,强化学习意识、创新意识、法律意识、责任意识、和谐意识等方面,加强档案管理干部队伍的建设。...
[会议论文] 作者:白晨;李丹丹;, 来源:第十届海峡两岸图书资讯学学术研讨会 年份:2010
[会议论文] 作者:荆朝霞;杨莹;, 来源:中国高等学校电力系统及其自动化专业第二十六届学术年会暨中国电机工程学会电力系统专业委员会2010年年会 年份:2010
基于代理的仿真成为电力市场研究的一种重要方法,智能代理模型是其中重要的研究内容之一.本文引进了一种综合了强化学习和信念学习的经验权重魅力值(EWA)算法,将其应用于电力...
[会议论文] 作者:张晓艳,唐昊,韩江洪,周雷, 来源:第29届中国控制会议 年份:2010
传统用于解决多Agent系统的分层强化学习(Hierachical Reinforcement Learning,HRL),基本上是建立在离散时间多Agent半马尔科夫决策过程(Discrete Time...
[会议论文] 作者:孟祥萍,魏本艳,于雪芳,苑全德,皮玉珍, 来源:2010系统仿真技术及其应用学术会议 年份:2010
探讨各种复杂非线性现象的强大工具.本文提出了一种新的基于多Agent系统理论(MAS)和量子算法的人工神经网络.在该人工神经网络中所有节点都为有学习能力的量子计算Agent(QCMAS).通过训练QCMAS强化学习...
[会议论文] 作者:邓丽群, 来源:广东省质量协会,湖北省质量协会,河南省质量协会,湖南省质量协会 年份:2010
中南院通过明确工作目标,制定工作计划,强化学习培训,增强全员意识,积极参加评优,开展企业自评,发挥领导核心作用,构建科学战略目标,实施“西进、走出去、转型”经营战略,拓宽多元化目标市场,重视人才队伍和基础设施建设...
[会议论文] 作者:陈新生,金石, 来源:国家检察官学院,中国人民大学法学院,南京市人民检察院 年份:2010
深刻认识到,要使三项重点工作达到预期效果,必须着力在以下几个方面下功夫:必须在领导干部带头上下功夫,必须在强化学习、武装思想上...
相关搜索: