基于深度强化学习的离散型制造企业车间动态调度研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:beijiqie123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了适应变化万千、竞争激烈的市场环境,制造企业向多类型、小规模的离散制造模式转变,导致车间生产过程变得复杂动态,发生突发事件的概率大大提高。而目前离散型制造企业使用的车间调度系统,同生产实际情况相差甚远,在复杂动态场合很难应用,通常需要人工对调度方案进行适应性调整。但是人工调整的优劣取决于调度员的经验和知识水平,而且往往需要耗费大量的时间和劳动力,调度方案的稳定性及车间生产效率难以保证。所以,迫切需要改善生产车间依赖人工调整的现状。与此同时,智能制造与数字化工厂的发展,使生产车间产生大量数据,为机器学习的应用提供了可能。在这种环境下,使用深度学习、深度强化学习,开发基于这些数据的自学习、自适应车间调度系统,不仅考虑了这些数据的价值,还可以通过数据对实际调度车间的实现动态感知和智能控制,从而指导实际生产过程出现的各种动态问题,实现车间自适应调度,缓解车间对人工调整的依赖。因此,本文针对车间调度系统在实际应用过程中过度依赖人工的特点,通过对车间历史及实时数据的研究和人工调整经验的总结,将深度学习、深度强化学习融入到高级计划与排程技术,训练生产系统的学习能力,提高生产调度的自适应性和实时性,使调度方案能够更好地适应复杂动态的实际生产过程。主要研究工作如下:(1)通过对生产调度隐性扰动场景的研究,总结不同生产场景下人工调整操作及其效果,设计隐性扰动场景下人工调整方式的选择模型。首先,利用遗传算法仿真出理想调度方案与实际调度方案的累计误差时间作为重调度的触发点。其次,记录该时刻遗传仿真出的生产信息作为深度学习的输入,遗传仿真出的最优人工调整方式作为输出。最后通过LSTM网络,学习生产过程中生产信息与人工调整方式的内在联系,实现隐性扰动下的人工调整方式的选择,并通过具体实例验证了算法的可行性。在隐性扰动场景结合深度学习方法,使得调度方案具有高适用性与通用性。(2)通过对车间显性扰动场景的研究,将具有感知能力的深度学习和具有决策能力的强化学习相结合,将深度强化学习的方式应用于复杂动态车间调度。首先,把车间调度问题视为序列决策问题,以实时生产环境信息作为状态空间,以调度规则作为动作空间,使用加工时间与最大完工时间的组合设置奖惩函数。同时,使用一种多智能体DDPG的深度学习方法训练模型,提高算法更新效率,实现根据实时生产环境信息自动匹配较优的实时调度策略。将深度强化学习的方式融入到APS系统中,提供了一种通用性框架。(3)通过车间调度的标准测试数据,对比遗传算法、传统强化学习算法以及单一调度规则,分别在静态和动态场景下验证作业车间深度强化学习算法的实时性和有效性。本文方法在静态环境中与最优解的调度准确率为91.05%,在动态环境下的准确率为81.28%。与单一调度规则对比,本文算法在保证了实时性的基础上,同时提高了求解质量。与启发式搜索算法进行对比,虽然解的质量略有不足,但算法灵敏性、动态性都得以大幅改进。最后,根据本文研究内容,搭建动态车间调度可视化平台,方便操作人员使用。
其他文献
世界油气资源供应日趋紧张,石油勘探开发开始涉足北纬60°以上的高纬度地区。该地区蕴藏着丰富的石油资源,但是冬季漫长,气候寒冷,要求钻机工作环境温度能达到-40℃甚至更低,
目的探讨太原市空气污染对早产的急性影响。方法通过太原市出生监测系统收集2005年11月1日—2007年1月7日期间太原市早产儿资料,从山西省气象局获得气象资料(平均温度、相对湿
2017年上海高考数学不再分文理科,《〈上海市中小学数学课程标准(试行稿)〉调整意见》将三视图由原来文科学生的拓展内容调整为所有学生的必修内容,因此,三视图必定成为新高考的热
高职院校是基础人才教育基地,承载着为国家培养基层高技能人才的使命,在促进国家的发展中发挥着越来越大的作用。高职院校的采购活动不仅能更好的实现学校教育的服务价值,也能为其教育管理、人才培养、产教融合、实验实训等提供可靠的保障。作为使用财政拨款的公益二类事业单位,高职院校在进行政府采购时要遵循相应的法律法规合理使用资金,因此高职院校政府采购的内部管理尤为重要。本文在对多所高职院校进行深度调研和分析的基
随着中国经济经历了令人瞩目的发展,人们的生活水平也得到了跨越式的提高,但是发展带来的变化并不都是正向的。改革开放以来,我国的收入分配结构发生了巨大的变化,收入不平等问题也越发严重。收入分配问题已经为人们所重视,但是这种重视主要基于横向维度上收入不平等的研究,即研究同时期所有居民的收入不平等问题。鉴于我国收入不平等现象持续恶化的现状,需要拓宽研究的视野,从纵向维度研究收入分配问题,即从代际收入传递的
多能协同园区(Muti-Energy Park,MEP)具有多能源互补与高效利用等诸多优点,受到了国家政策的支持和学术界的广泛关注。然而,MEP具有能量品类繁多、多能流耦合复杂等特点,在能
“创造性叛逆”这一说法来源于埃斯卡皮在1987年出版的《文学社会学》中提到:“如果大家愿意接受翻译总是一种创造性叛逆这一说法的话,那么翻译这个带刺激性的问题也许能获得解决。”翻译的叛逆性在于它把作品置于一个完全没有预料到的参照体系中;翻译的创造性在于它赋予作品一个崭新的面貌。谢天振教授在其1999年出版的《译介学》中将埃斯卡皮提出的“创造性叛逆”这一说法引入国内,并提出“创造性叛逆”的主体包含有三
China Men出版于1980年。在这部小说中,美籍华裔作家汤亭亭描写了祖父辈华人在美国的经历,叙述了19世纪中叶至20世纪60年代移居美国的华人境遇及其为建设美国所作的贡献。该小说在中国大陆有李美华译本(译名为《金山华人》)和肖锁章译本(译名为《中国佬》),分别出版于1985年和2000年。本文运用创造性叛逆分析了原文中各类文化意象传递到译文中的结果,对比了两个中译本中文化意象创造性叛逆的异同
比特币是迄今为止最具有创新性的数字货币,比特币的出现可以说是货币史上的一场革新。然而比特币诞生至今,不断遭受到人们的质疑,它的价格也暴涨暴跌且极不稳定,这也引发了我们对比特币的相关思考。本文从经济学的角度对比特币的特征、发展阶段、货币属性、资产属性、价格机制以及价格影响因素做了深入的研究。比特币特殊的生产和发行机制,使得比特币不需要中央发行机构。对比实物货币和信用货币,比特币虽然没有信用做担保以及
目的:探讨AngioJet血栓清除装置在治疗亚急性深静脉血栓治疗中的有效性及安全性。方法:回顾性分析2015年06月至2018年03月至我科治疗的74例亚急性深静脉血栓的患者的临床资料,其中30例采取AngioJet联合置管溶栓治疗(A组),44例采取单纯置管溶栓(B组)。统计分析两组治疗期间溶栓时间、尿激酶剂量、血栓清除率、血管通畅度、并发症情况以及随访12月后PTS发生率、血栓复发情况。结果: