基于强化学习的动态并行机调度研究

来源 :沈阳理工大学 | 被引量 : 1次 | 上传用户:xyhanhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
制造业是现代工业的基石。随着信息技术等重要领域的革新与突破,制造业开始向智能化、绿色化转型。对生产过程进行合理调度可以提升企业竞争力。但企业在实际生产过程中,由于系统或人为的一些动态因素,如加工时间变化、机器故障等,使得原调度方案变成次优或不可行,造成产品质量下降,增加能源消耗。因此,对生产过程进行合理的动态调度,有利于提高企业智能化、绿色化水平,降低生产成本、提升产品质量、降低能源消耗。本文以钢铁企业高炉—转炉区间段为研究背景,分析运输特征及生产过程中的动态因素,分别提炼出动态并行机生产调度问题、运输与并行机生产协调调度问题。以最小化工件逗留时间和的期望为目标函数,分别建立生产调度的优化模型、运输与生产协调调度的优化模型。强化学习是机器学习的一种,相比于其他方法,不需要建立确定的问题模型,适用于解决动态调度问题。但调度问题状态空间过大,在使用强化学习算法求解时易陷入“维数灾难”。因此,本文基于Q-learning算法及函数逼近思想,设计求解算法,不仅可以解决大规模调度问题的数据内存问题,在求解精度上也有一定优势,具有稳定性。本文主要研究内容如下:(1)以转炉炼钢生产过程为研究背景,提炼出动态并行机生产调度问题。考虑生产环境中工件释放时间、加工时间及机器故障时间为随机变量,以最小化工件逗留时间和的期望为目标函数,建立混合整数规划模型。将生产调度问题转换为多阶段决策问题,根据加工时间等随机变量对生产环境产生的影响划分强化学习算法中的状态、动作,应用线性函数泛化器解决数据存储问题,结合Q-learning算法对问题进行求解。实验结果表明,基于线性函数泛化器的Q-learning算法具有较好的有效性及稳定性。(2)以高炉—转炉连续生产过程为研究背景,提炼出运输与并行机生产协调调度问题。在运输阶段,有多台运输车,其容量为1,限制运输时间;在生产阶段,工件释放时间、加工时间为随机变量,以最小化工件逗留时间和的期望为目标函数,建立运输与生产协调调度模型。将运输生产两阶段问题转换为多阶段决策问题,结合运输特征及生产中的动态因素,分别设定运输与生产阶段状态空间、动作空间,应用基于线性函数泛化器的Q-learning算法对问题进行求解。实验仿真结果验证了本文提出的Q-learning算法在解决运输与并行机生产协调调度问题的有效性。
其他文献
<正>随着中国经济放缓的持续,企业高负债现象不断扩展恶化,进而拖累银行业不良贷款激升。针对此种状况,中国当局准备重新采用债转股的方式,旨在解决企业负债沉重和银行业不良
会议
<正>络病是指各种因素导致络中营卫气血、津液运行、输布及渗化失常,最终出现络脉疲滞、痹阻不通的一类病证,临床以疼痛为主要表现。而疼痛是慢性前列腺炎(chronicprostatiti
本文从应用和技术两个方面,分析了通信与计算相结合的计算机体系结构的研究与开发现状,以及云、网、端方面的新兴应用对处理器结构的需求,提出了适合通信应用的众核处理器研
四川攀西地区的西昌拥有独特的自然条件,乡村农业旅游资源丰富而集中,品质优良,可开发设计赏花、尝果、采摘、垂钓等体验式乡村旅游活动。该研究采取“人、事、时、地、物”5要
<正>孙申田教授是著名中医针灸专家,黑龙江省中医药大学针灸推拿学院院长,博士生导师;中医药高等院校《经络学》教材副主编;中国针灸协会理事;孙申田教授从事中医针灸教学、
会议
通过试验,对味精离交污水的生物脱硫处理技术进行研究,结果表明,该脱硫处理技术的最佳脱硫效率可达95%.经生物脱硫后的污水可顺利地进行厌氧生化处理,极大地降低该污水的处理
针对地质勘察行业粉尘作业的多样性,以呼吸性粉尘检测结果作为指标,提出了对现有不同防尘技术措施的呼吸性粉尘控制效果评价的几种方法,并进行了初步评价。