基于深度强化学习近端策略优化的电网无功优化方法

来源 :电网技术 | 被引量 : 0次 | 上传用户:jingjing2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新能源和负荷波动给无功优化带来更大的挑战。本文考虑新能源和负荷时变特性,将无功优化问题构建成强化学习问题。提出了约束—目标划分和目标预设的方法设计奖励函数,并采用近端策略优化算法求解强化学习问题,获得无功优化策略。以改进的IEEE39系统开展案例分析,结果表明所提的奖励函数能提高智能体收敛速度,基于强化学习求解的无功优化策略在决策效果和决策时间上优于传统确定性优化算法。
其他文献
1背景、目的及意义慢性阻塞性肺疾病(chronic obstructive pulmonary disease, COPD,简称慢阻肺)是一种常见、可以预防和治疗的慢性气道疾病,以持续存在的呼吸系统症状和气流受限为特征,通常因明显暴露于有毒颗粒或气体引起以气道和肺泡结构遭到破坏所致。慢性阻塞性肺疾病急性加重(acute exacerbation of chronic obstructive pul
期刊
目的 汉化儿科患者心理社会风险评估(Psychosocial Risk Assessment in Pediatrics,PRAP)量表,并检验其信效度。方法 获得原作者授权后进行翻译、文化调适,形成中文版PRAP量表。采用便利抽样法,选取2021年3月—5月于上海市某三级甲等儿童专科医院住院的167例患者进行心理社会风险评估,检验量表的信效度。结果 中文版PRAP量表包括性情、诊疗环境中的焦虑和
嗑CP,表面看起来嗑的是CP两人,其实嗑的都是我们真实生活中情感的投射。我们羡慕强者,也欣赏权力平等、相处甜蜜的爱情,所以在书籍、影视剧中嗑又甜又强的CP,就成了我们寄托美好期望的方式。《你是我的荣耀》大结局了,航天设计师于途和女明星乔晶晶的爱情甜倒了一众网友。两人不仅甜,还都热爱工作,于途科研忙碌,加班是常态,回家还要写论文。乔晶晶的敬业人设也屹立不倒,坚持用作品说话。
期刊
空腹夹层板结构的U形钢板-混凝土组合下肋梁采用装配化施工时,将拼接节点设置于跨中位置具有受力明确、施工方便的优点,但拼接节点处的较大拉力也使其成为整个结构的薄弱区域.为研究U形钢板-混凝土组合下肋梁拼接节点的力学性能,设计了5组U形钢板-混凝土组合梁拼接节点足尺试验模型,开展了拉力荷载下的静载试验,通过与有限元模型进行对比分析,明确了拼接节点在拉力作用下的内力分布规律与破坏模式,揭示了栓钉布置形式
严重大面积烧伤病人,自体皮常常不足,不得不寻求其他生物敷料。冻存异体皮移植于创面可与创基建立血管,良好地封闭创面,防止感染与创面水分蒸发,减少超高代谢。我科自1998年底建立皮库,临床应用冻存异体皮面积达4840000cm~2,活力达到新鲜皮肤的70%左右,皮肤质地色泽与新鲜皮一样,临床
会议
学位
为解决依赖受控系统数学模型而导致的数据驱动控制性能不完善,控制跟踪结果误差较大的问题,提出一种基于近似Q-学习算法的数据驱动控制方法。为使Q被充分学习,在时间轴的立即回报序列上估计训练值,因此修改确定性规则,使其采用当前Q值和修正后估计衰减值计算加权平均值计算,实现算法收敛。采用以Q-学习算法为结构的控制器代替受控数据当前工作点的一般非线性模型,并且仅使用被控对象提供的数据来评估模型中的伪偏导函数
针对城市生活垃圾分类收运过程中存在的环境二次污染和垃圾产生量不确定性等问题,提出了一种基于智能垃圾桶的动态收运车辆路径优化方法。建立以最小化碳排放成本、燃油消耗成本、固定成本和车辆延迟到达惩罚成本为目标的动态车辆路径优化模型。采用滚动时域的方式将动态问题转换为一系列静态问题,并设计两阶段算法进行求解。首先采用粒子群算法对收运车辆路径进行规划,而后在每个时域末,综合考虑待清运垃圾桶的位置和垃圾量、垃
我国语文教科书在百年的发展历程中,逐步形成以选文为统领,教科书其它构成部件围绕选文来编排的模式。“部编本”语文教科书继续沿袭这一模式,同时饱含自身特色。选文与编排作为语文教科书的核心要素和结构体例,不仅在一定意义上传达了语文教科书的教育理念,还决定着语文教科书的质量水平,影响着语文教科书功能的发挥,语文教科书选文与编排如何落实贯穿其理念中的精气神,显得尤为重要。“部编本”小学语文教科书在国家政策与