基于深度强化学习的云制造服务组合

来源 :长安大学 | 被引量 : 0次 | 上传用户：aa4578

【摘要】

：

【作者】

：

张海峰

【机构】

：

长安大学

【出处】

：

长安大学

【发表日期】

：

2021年01期

【关键词】

：

云制造服务组合深度强化学习深度确定性策略梯度算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

云制造是一种基于云计算、物联网以及大数据等新兴技术发展起来的面向服务的制造模式。它集成了分布式的制造资源并进行集中管理,以向消费者提供按需制造服务,从而促使资源的全面共享,提高资源的利用效率。云制造中一个重要问题是组合多个不同的制造服务构成增值服务以满足用户多阶段的复杂制造需求,即服务组合问题。在确定了子任务加工顺序的服务组合中使用启发式和元启发式算法不仅会降低算法的灵活性,而且会出现当任务或服务的规模发生变化、服务不可用时需要人工调节算法参数等问题。因此,论文通过引入深度强化学习（Deep Reinforcement Learning,DRL）算法来解决面向单复合任务的制造云服务组合问题。DRL算法是一种人工智能算法,其结合了深度学习对复杂环境的感知能力和强化学习对问题的决策能力,该算法通过学习不同服务组合之间固有的模式和规则,从而寻找一种可解决云制造服务组合（Cloud manufacturing service composition,CMfg-SC）问题的有效方案。深度强化学习算法分为两种类型:基于离散变量的算法和基于连续变量的算法。在CMfg-SC问题中,不仅需要考虑当前子任务对应的最优服务,同时需要考虑在满足任务服务质量（Quality of Service,Qo S）约束的情况下,实现面向该任务的组合结果的整体Qo S最大化。因此,论文将基于连续变量的深度确定性策略梯度（Deep Deterministic Policy Gradient,DDPG）算法引入,以解决云制造环境中的服务组合问题。首先,提出了一种考虑物流服务质量的CMfg-SC模型,包括单个复合任务模型、资源模型及物流服务模型,并结合相应的组合指标。其次给出了模型的目标函数及约束条件,并依据该模型建立了马尔科夫决策过程（Markov Deecision Progress,MDP）。最后采用DDPG算法来求解仿真案例下的CMfg-SC问题。为了验证该算法的有效性以及面向复杂的制造任务时当生产制造过程中包含多种不确定性的情况下算法的应变能力,通过实验依次分析了算法在仿真环境下的有效性、当服务不可用时算法的自适应性及当任务和服务的规模发生变化时算法模型的可扩展性能。为了直观验证算法的性能,论文以蚁群算法（Ant Clony Optimization,ACO）作为基准,并通过与深度Q学习（Deep Q-Network,DQN）算法做对比,来验证本文所提算法在各方面的性能。实验结果表明,论文提出来的方法不仅能有效解决大规模的CMfg-SC问题。同时,在动态制造环境下,当服务不可用时,论文所提算法相较于基于值的DQN算法有着更好的自适应性。最后,分别对任务集与资源集进行扩展并实验验证,其结果表明,使用DDPG算法可以有效解决在动态变化环境下面向单复合任务的制造云服务组合问题,而使用蚁群算法来解决这类问题的时候,不仅需要人为调参,无法有效扩展,且通过论文所提算法训练得到的模型,更加适用于解决云制造环境下的服务组合问题。

其他文献

基于COI基因探讨塔里木河流域裂腹鱼属鱼类的亲缘关系

裂腹鱼属(Sehizothorax)是塔里木河流域分布的裂腹鱼亚科(Schizothoracids)鱼类中数量和种类最多的鱼类,具有重要的生态学研究价值.本研究对采自塔里木河和伊犁河流域的6种裂腹鱼属鱼类的COI基因序列进行了分析.结果显示,在419尾个体中共发现25个单倍型;塔里木裂腹鱼(Schizothorax biddulphi)塔里木河主要支流群体、宽口裂腹鱼(S.eurystomus)、重唇裂腹鱼(S.barbatus)和厚唇裂腹鱼(S.irregularis)之间的遗传距离小于0.005,未

期刊

塔里木河裂腹鱼属DNA条形码遗传距离

基于多级特征串联相关粒子滤波的视频目标跟踪

视频目标跟踪技术主要包括图像处理、模式识别和现如今炙手可热的深度学习和人工智能等技术,属于当前计算机视觉领域中一项至关重要的研究内容。为了克服执行跟踪任务时目标本身的变化和跟踪环境的随机性,学者们致力于研究一项性能优越的视频目标跟踪算法。本文致力于改善视频目标跟踪算法性能上的鲁棒性与精确性,针对基于多级特征串联的改进粒子滤波算法和相关粒子滤波算法来进行展开:1、针对传统的单一特征视频目标跟踪算法存

学位

粒子滤波算法多级特征串联相关粒子滤波算法相关滤波算法视频目标跟踪

四轮毂电动试验车电液复合制动系统研究

随着环境问题的日益严峻以及国家对能源安全战略的部署,近年来汽车行业正处于变革与发展当中,而节能减排、提高能量利用率是所有企业必须面对的热点问题。在车辆的制动系统中,电、液复合制动系统在保障制动安全性的前提下,能够通过电机再生制动回收部分制动能量以延长续航里程,并且能对车轮制动力进行单独调节,在动力学控制等方面具有较大的优势。本文在实验室四轮毂电动试验车的基础上,进行电、液复合制动系统的研究。通过分

学位

电液复合制动液压制动力调节复合制动试验压力跟随

扑草净对四角蛤蜊抗氧化酶活性及组织细胞的影响

为探讨扑草净胁迫对四角蛤蜊(Mactra veneriformis)的毒性效应,开展了不同质量浓度扑草净(0.2 μg/L、1.0 μg/L、10 μg/L)对四角蛤蜊21 d胁迫及15d净水释放实验,测定不同时间点鳃、消化腺中超氧化物歧化酶(superoxide dismutase,SOD)、过氧化氢酶(catalase,CAT)和谷胱甘肽过氧化物酶(glutathione peroxidase,GPx)等抗氧化酶活性,观察鳃组织细胞形态学变化.结果表明,扑草净对四角蛤蜊SOD、CAT、GPx均有一定

期刊

扑草净四角蛤蜊抗氧化酶活性组织细胞毒性效应

基于深度强化学习的云制造服务组合

其他学术论文