【摘 要】
:
AGC是一个动态多级决策问题——马尔可夫决策过程(MDP),应用强化学习算法可有效地实现控制策略的在线学习和动态优化决策。引入Q学习算法作为强化学习核心算法,将CPS值看作包
【基金项目】
:
国家自然科学基金项目(50807016);广东省自然科学基金博士启动基金项目(06300091)~~
论文部分内容阅读
AGC是一个动态多级决策问题——马尔可夫决策过程(MDP),应用强化学习算法可有效地实现控制策略的在线学习和动态优化决策。引入Q学习算法作为强化学习核心算法,将CPS值看作包含AGC的电力系统"环境"所给的"奖励",依靠奖励值Q函数与CPS控制动作形成的闭环控制结构实现在线学习。学习目标是使CPS控制动作从环境获得的长期积累奖励值最大,从而快速自动地在线优化CPS控制系统的输出。仿真研究显示,引入强化学习自校正控制后显著增强了整个AGC系统的鲁棒性和适应性,有效提高了CPS考核合格率。
其他文献
苏联解体后,意识形态的剧变给俄军的思想教育工作带来了空前的挑战。俄军在继承苏联军队优良传统的基础上,对思想教育工作进行了合理的创新和发展:教育内容从爱国主义向人文
社会审计,它发端之初就在其商业抱负与对公众利益的承诺间存有冲突。整个行业的发展,就一直在这种冲突中奋争着,既要维护独立价值的神圣性,又要保护自己的商业竟争力。由于竞
<正>随着人民生活水平的不断提升,建筑行业也处在升级转型的关键时期。当前的建筑行业对建筑实体的需求不再只追求基本的居住、办公、购物等功能,而是更加关注建筑整体的造型
教材是基础教育课程与教学领域的重要要素,其质量监测是基础教育课程评价改革的中心任务,与课程标准的一致性是考核教材质量的核心指标。小学数学教材习题作为教材中十分重要
文章以《都市健康人》为例,对健康科普期刊营销渠道进行了分析,提出期刊要通过品牌建设、新媒体合作、加强期刊征订工作、零售渠道终端管理创新等方式创新期刊营销渠道,为我
国有企业基层党组织是党在国有企业中的基础力量,在促进企业改革发展、服务企业生产经营中发挥着不可替代的作用。当前,创新国有企业基层党建工作,需要适应全面从严治党的形
<正>政府采购作为财政支出的方式之一,从本质上说,其采购活动应遵从财政支出的原则,即支出效益要实现经济效益、社会效益、环境效益最大化,做到"物有所值"。"物有所值"要求政
首先分析了目前校园网的安全现状,介绍了入侵检测系统的相关知识,然后通过分析校园网的安全现状和校园网的网络拓扑结构,设计了一种分布式入侵检测系统。具体描述了校园网体
青年官兵网络心理具有上网动机强烈、信息汲取盲目、网络社交情感冲动、信息传播意愿突出等特点。这种心理特点产生的因素包括官兵精神生活多元化的需要、青年期个性发展的需