A Novel Approach Based on Reinforcement Learning for Finding Global Optimum

来源 :最优化(英文) | 被引量 : 0次 | 上传用户:bolun365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
A novel approach to optimizing any given mathematical function, called the MOdified REinforcement Learning Algorithm (MORELA), is proposed. Although Reinforcement Learning (RL) is primarily developed for solving Markov decision problems, it can be used wi
其他文献
我厂生产的产品中有一种法兰零件,如图1所示,材料为Q235A钢板。其中φ150^+0.16 0mm需要在车床上加工,而零件壁厚的最薄处仅4mm,在车床上用四爪单动卡盘夹紧易变形,加工出来的φ150
目的了解苏州工业园区的麻疹流行病学特征,为本地区制定控制策略提供依据。最终达到2012年麻疹发病率控制在1/100万以下和无本土麻疹病毒传播的麻疹消除目标。方法麻疹发病资料
汉语中“说不上X”结构适用范围广、频率高,而据结构内部关系和整体语义的不同,存在多个小类。“说不上X”小类结构间存在密切演变关系,构式阶段的“说不上X”是在前期阶段的
We constructed a volume particle-tracking velocimetry (Volume-PTV) algorithm for comparisons with the tomographic particle image velocimetry (Tomo-PIV) algorith
In this paper, a new filled function with only one parameter is proposed. The main advantages of the new filled function are that it not only can be analyzed ea
结合我国的实际国情,建立和完善"以居家养老为基础,以社会服务为依托,以机构养老为补充"的养老模式,形成投资主体多元化、服务内容多样化、适宜老年人需求的社会化养老服务体
分析了装备维修性设计与分析技术的基本内涵,包括主要工作范畴和关键技术。调研了国内外维修性设计与分析技术在理论研究和成果应用等方面的发展现状,并探讨了未来装备维修性
网络教学平台是网络教学过程中的支撑环境,是现代化教育发展的必然选择。本文首先对高职日语教学现状进行了分析,然后提出搭建高职日语网络教学平台的必要性,并提出了日语教
双酚A(Bisphenol A, BPA)是一种重要的工业原料,主要用于生产高分子材料环氧树脂与聚碳酸脂。现有的动物实验表明,双酚A具有明确的内分泌干扰作用,具有生殖与发育毒性,影响亲
甘薯食用过程中易产生胀气是限制其成为主食的主要原因。胃肠胀气常常会导致腹胀、腹部疼痛等肠胃不适症状。本论文主要从三个方面对甘薯胀气因子进行研究:(1)测定甘薯中可溶性