A Novel Approach Based on Reinforcement Learning for Finding Global Optimum

来源 :最优化(英文) | 被引量 : 0次 | 上传用户：bolun365

【摘要】

：

A novel approach to optimizing any given mathematical function, called the MOdified REinforcement Learning Algorithm (MORELA), is proposed. Although Reinforceme

【作者】

：

Cenk Ozan Ozgur Baskan Soner H

【机构】

：

DepartmentofCivilEngineering,DepartmentofCivilEngineering

【出处】

：

最优化(英文)

【发表日期】

：

2017年2期

【关键词】

：

REINFORCEMENT LEARNING MATHEMATICAL Function Global OPTIMUM Sub-Environment ROBU

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

A novel approach to optimizing any given mathematical function, called the MOdified REinforcement Learning Algorithm (MORELA), is proposed. Although Reinforcement Learning (RL) is primarily developed for solving Markov decision problems, it can be used wi

其他文献

薄壁法兰加工工艺的改进

我厂生产的产品中有一种法兰零件，如图1所示，材料为Q235A钢板。其中φ150^＋0.16 0mm需要在车床上加工，而零件壁厚的最薄处仅4mm，在车床上用四爪单动卡盘夹紧易变形，加工出来的φ150

期刊

加工工艺法兰零件薄壁Q235A车床钢板壁厚夹紧

2008年苏州工业园区麻疹流行病学特征及控制策略

目的了解苏州工业园区的麻疹流行病学特征，为本地区制定控制策略提供依据。最终达到2012年麻疹发病率控制在1／100万以下和无本土麻疹病毒传播的麻疹消除目标。方法麻疹发病资料

学位

麻疹流行病学特征控制策略

析“说不上X”结构及其主观化过程

汉语中“说不上X”结构适用范围广、频率高,而据结构内部关系和整体语义的不同,存在多个小类。“说不上X”小类结构间存在密切演变关系,构式阶段的“说不上X”是在前期阶段的

期刊

“说不上X”结构演变主观化构式

Performances of Volume-PTV and Tomo-PIV

We constructed a volume particle-tracking velocimetry (Volume-PTV) algorithm for comparisons with the tomographic particle image velocimetry (Tomo-PIV) algorith

期刊

Volume-Particle-TrackingVELOCIMETRYTomographic-ParticleImageVELOCIMETRYRing

A New Filled Function with One Parameter to Solve Global Optimization

In this paper, a new filled function with only one parameter is proposed. The main advantages of the new filled function are that it not only can be analyzed ea

期刊

GLOBALOptimizationFILLEDFunctionMethodSMOOTHINGTechniqueGLOBALMinimizeL

浅析我国养老服务产业发展现状及对策

结合我国的实际国情,建立和完善"以居家养老为基础,以社会服务为依托,以机构养老为补充"的养老模式,形成投资主体多元化、服务内容多样化、适宜老年人需求的社会化养老服务体

期刊

人口老龄化养老模式人口红利

装备维修性设计与分析技术

分析了装备维修性设计与分析技术的基本内涵,包括主要工作范畴和关键技术。调研了国内外维修性设计与分析技术在理论研究和成果应用等方面的发展现状,并探讨了未来装备维修性

期刊

维修性维修性设计维修性分析

高职日语基础课网络教学平台的设计与应用

网络教学平台是网络教学过程中的支撑环境,是现代化教育发展的必然选择。本文首先对高职日语教学现状进行了分析,然后提出搭建高职日语网络教学平台的必要性,并提出了日语教

期刊

高职网络教学教学平台

双酚A职业接触限值的研制

双酚A(Bisphenol A, BPA)是一种重要的工业原料,主要用于生产高分子材料环氧树脂与聚碳酸脂。现有的动物实验表明,双酚A具有明确的内分泌干扰作用,具有生殖与发育毒性,影响亲

学位

职业接触限值健康体检资料发育毒性接触组职业卫生标准毒理学研究荧光检测法bisphenol空腹血糖异常生殖器官

甘薯胀气因子研究

甘薯食用过程中易产生胀气是限制其成为主食的主要原因。胃肠胀气常常会导致腹胀、腹部疼痛等肠胃不适症状。本论文主要从三个方面对甘薯胀气因子进行研究：（1）测定甘薯中可溶性

学位

甘薯可溶性糖高效液相色谱胀气淀粉

A Novel Approach Based on Reinforcement Learning for Finding Global Optimum

与本文相关的学术论文