基于强化学习的动态单机调度研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:littleshrimp1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生产调度位于计算机集成制造系统体系结构中的中间层,是控制与管理一体化的接合部。向上要给企业经营战略决策层提供决策依据,向下要安排生产加工任务,指导监督控制层的运作。因此,生产调度是实施计算机集成制造系统的关键。在实际生产过程中,绝大多数的调度问题都属于动态调度问题。目前,大部分动态调度问题都利用调度规则来进行解决,但调度规则本质上是一种局域内的贪心搜索方法,盲目追求单一目标,同时其无法根据系统环境状态的改变进行自适应调整,因此没有一种调度规则能够在系统各项重要调度性能指标下都表现出良好的调度性能。因为Agent具有适应动态变化环境以及交互协商的能力,因此很多学者利用Agent技术来解决动态调度问题,但如何提高Agent的学习能力是Agent适应动态变化环境和提高交互协商能力的基础和关键。强化学习是实现Agent学习机制的有效途径,作为一种常用的强化学习算法,Q学习由于不受应用模型约束,在制造领域得到了广泛研究,但目前基于Q学习的Agent生产调度优化研究还很少。本文构建了模式驱动调度系统,并结合智能体技术,对强化学习在这一系统中的应用机制进行了研究。通过MATLAB实验仿真,对模式驱动调度系统在动态单机调度问题中的调度性能进行了分析。仿
其他文献
网络舆情因为其依托于网络,具有自身的特殊性。对大众心态的形成和大众心理问题的疏解预防产生了积极影响。同时,确保马克思主义在意识形态领域的指导地位。 Internet publi
轧机的压下装置是轧机的重要结构之一,用于调整辊缝,也称辊缝调整装置,其结构设计的好坏,直接关系着轧件的产量与质量。简要介绍轧机压下装置的几种形式及优缺点
建立电力企业信息系统评价指标体系,用科学、客观的测度方法综合评价电力企业信息系统的建设效果,对加速电力企业的信息化建设,提高电力企业的竞争能力具有十分重要的意义。
2014年泗洪县发现美国白蛾,2015年被国家林业局定为美国白蛾疫区,2016年泗洪县在全县范围开展飞机施药防治美国白蛾。水产养殖区使用20%氯虫苯甲酰胺悬浮剂,非水产养殖区使用
针对三相四开关逆变器(TPFSI)电压输出能力受限,且传统过调制方法存在输出三相电压基波幅值不平衡的问题,提出一种考虑输出电压平衡的空间矢量脉宽调制过调制算法。首先,推导
"南方的才子,北方的将,陕西的黄土埋皇上。"——关中民谣作为中国历史上的十三朝都会之所在,关中人当然有充分骄傲的资本。可谁能想到如今在渭河谷地山风中破残的石头堆竟是千
企业薪酬制度是企业激励机制的重要内容。在市场经济条件下,薪酬作为人力资源的劳动报酬,其分配是否科学合理,直接关系到员工劳动的积极性,影响着人力资源的合理配置,进而影响着企
随着经济全球化和信息时代的到来,市场竞争日趋激烈,面对严酷的市场竞争,一个企业要想取得竞争优势,求得生存和发展,必须不断提高其整体效能和绩效,以更加长远的眼光对待公司的经营
针对试验任务中制定设备布站方案、实时数据处理的试验方案等决策问题,介绍了模糊数学相关的概念和基本原理,结合有关具体实例详细说明了应用模糊综合判别的方法对测量设备完成任务的情况进行评估,为后续试验测量设备的选择、布站以及选优方案中设备优先级的设置提供有力的指导及更科学的依据。
随着社会主义经济高速发展,人们的生活水平日益提升,并越发重视饮食的口感与健康。农业种植也应当与时俱进,以适应人们日益增长的需求。近年来,有机农业种植技术被广泛使用,