搜索筛选:
搜索耗时0.6808秒,为你在为你在102,285,680篇论文里面共找到 215 篇相符的论文内容
类      型:
[期刊论文] 作者:黄晗文,郑宇,, 来源:计算机工程与科学 年份:2011
本文提出一种基于定性模糊网络的强化学习知识传递方法。该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识。这...
[学位论文] 作者:胡坤, 来源:太原理工大学 年份:2011
强化学习的实际应用中,“维数灾难”问题一直困扰着其发展。虽然“维数灾难”问题是由待解决问题的本质所决定的,无法从根本上进行消除,但是却可以从方法上加以克服。分层...
[期刊论文] 作者:邢长明,刘方爱,, 来源:控制与决策 年份:2011
惯性权重是微粒群算法(PSO)的重要参数,它可以平衡算法的全局和局部搜索能力的关系,改善算法的性能.对此,提出一种基于强化学习的适应性微粒群算法(RPSO).首先将不同惯性权重...
[期刊论文] 作者:王晓燕,刘全,傅启明,张乐,, 来源:计算机工程 年份:2011
为解决传统遗传算法早熟收敛和收敛速度慢的问题,提出一种基于强化学习的多策略选择遗传算法MPSGA。通过使用不同的选择策略将整个种群划分为3个子种群并分别进化,能提高种群...
[期刊论文] 作者:温凯歌,杨照辉, 来源:计算机工程 年份:2011
根据交通流及交叉口信号特征,建立强化学习的状态空间、动作空间和回报空间,以最小化车辆在交叉口的延误为控制...
[期刊论文] 作者:黄爱娟,苏和,李斌,, 来源:临床医学工程 年份:2011
目的分析强化学习外科抗生素使用指南前后我院普外科围手术期抗生素的使用情况。方法从2007年1月至2011年1月间我院普外科手术住院患者的资料中选取320份,其中强化学习前160...
[期刊论文] 作者:沈乐,毛新军,董孟高, 来源:计算机工程与科学 年份:2011
强化学习是机器学习领域中的一...
[期刊论文] 作者:夏培顺,, 来源:解放军艺术学院学报 年份:2011
为提高学员的知识水平和军事素质,加强军事体能训练,2月9日至18日,学院利用寒假组织全体本科学员和2010级士官中专学员,进行了强化学习训练。In order to improve the know...
[期刊论文] 作者:陈功,周谊成,王辉, 来源:电脑知识与技术:学术交流 年份:2011
计算机乒乓游戏是出现在个人计算机上最早的游戏之一,该文利用强化学习中的TD算法,将状态的变化与得分的统计规律统计出来,就是研究在当前状态S下,球拍怎样移动获利最大,让机器击...
[期刊论文] 作者:尚晶,徐长生,, 来源:武汉理工大学学报 年份:2011
提出了基于Q学习算法的集卡调度强化学习模型,对其系统...
[期刊论文] 作者:温凯歌,曲仕茹,, 来源:交通信息与安全 年份:2011
针对公路交通流非线性、不确定性和模糊性特点,提出了面向控制的交通网络宏观动态离散模型,并且引入分布式强化学习来解决交通网络的控制与诱导问题。以传统网络交通流模型Me...
[期刊论文] 作者:周川,狄东杰,陈庆伟,郭毓,, 来源:动力学与控制学报 年份:2011
提出了一种基于神经元强化学习(Neuron-based Reinforcement Learning,NRL)的自适应AQM算法,采用链路速率和队列长度作为拥塞指示,可根据网络环境的变化在线自动调整神经元参数...
[期刊论文] 作者:李国军,刘江,孙冬梅, 来源:吉林农业:下半月 年份:2011
农发行吉林市分行营业部在开展合规管理年活动中,以完善制度建设为基础,以强化学习加强宣传为手段,突出“强”、“严”、“实”的特点,不断提高规范化、精细化管理水平,扎实推动“...
[期刊论文] 作者:张文柱,邵丽娜,, 来源:西安电子科技大学学报 年份:2011
提出了一种基于归一化径向基函数的自适应启发评价强化学习算法,用于异构无线网络系统中自主的动态频谱分配.该算法利用归一化径向基函数自适应构建状态空间,加快学习速度;利...
[会议论文] 作者:汤萍萍, 来源:中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会 年份:2011
本文将基于强化学习对服务组合方法进行深入的研究,并最终得到RLA算法。同时还有实验数据为佐证,充分显示了RLA的性能。...
[期刊论文] 作者:段勇,伊婧,张永赫,徐心和, 来源:高技术通讯 年份:2011
针对强化学习(RL)中状态空间过大所引起的学习时间过长或算法难于收敛等问题,提出了一种基于矢量量化(VQ)技术的表格型强化学习方法——VQRL方法,该方法用矢量量化器的码书矢量来逼...
[期刊论文] 作者:张晶晶,周德云,张堃,, 来源:计算机应用研究 年份:2011
仿真结果显示此算法收敛且UAV快速搜索到了目标,此结果表明,通过对UAV在设定条件下的强化学习训练,可以使其具备一定的环境适应能力,...
[期刊论文] 作者:汪攀, 来源:行政与法 年份:2011
摘 要:“民族地区要发展,政府能力须提高”。加快民族地区经济、社会的全面发展,必须不断提高公务员的综合素质,建设一支高素质的公务员队伍。因此,创建学习型政府并打造一支在政治上过硬、业务上精湛的公务员队伍,从而走出一条在“在学习中创新,在创新中学习”的具有......
[期刊论文] 作者:许培,薛伟,, 来源:计算机与数字工程 年份:2011
多Agent系统是近年来比较热门的一个研究领域,而Q-learning算法是强化学习算法中比较著名的算法,也是应用最广泛的一种强化学习算法。以单Agent强化学习Qlearning算法为基础,提...
[期刊论文] 作者:李海英, 来源:新天地:开拓教育新天地 年份:2011
运用现代化教学手段,把板书的内容,课后作业,课文中所描写的人物或景物放映出来,就能大大节省时间,提高课堂效率,更能激发学生的学习兴趣,从而调动其学习的主动性,最终达到提高语文课......
相关搜索: