基于深度强化学习与迭代贪婪的流水车间调度优化

来源 :控制与决策 | 被引量 : 0次 | 上传用户:chm200630990203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流水车间调度是应用背景最为广泛的调度问题,其智能算法研究具有重要的学术意义和应用价值.以最小化最大完工时间为目标,提出求解流水车间调度的一种基于深度强化学习与迭代贪婪算法的框架.首先,设计一种新的编码网络对问题进行建模,解决了传统模型受问题规模影响而难以扩展的缺陷,井利用强化学习训练模型以获取优良输出结果;然后,提出一种带反馈机制的迭代贪婪算法,以网络的输出结果为初始解,协同利用多种局部操作提高搜索能力,井根据性能反馈调节各操作的使用,进而获得最终的调度解.仿真结果和统计对比表明,所提出的深度强化学习与迭代贪婪融合的算法能够取得更好的性能.
其他文献
针对多机器人在未知区域的覆盖搜索问题,提出一种基于生物启发神经网络和分布式模型预测控制(DMPC)的多机器人协同搜索算法.利用栅格地图表示未知区域,基于栅格地图建立生物启发神经网络来表示动态搜索环境,生物启发神经网络中未搜索栅格的神经元活性值大于已搜索栅格和障碍物栅格.在此基础上,为了平衡机器人覆盖搜索过程中的短期收益和长期收益,避免后期陷入局部最优,引入DMPC作为决策方法.选择预测周期内机器人
针对加工时间不确定的可重入混合流水车间调度与预维护协同优化问题,构建以区间最大完工时间、区间总碳排放和区间总预维护费用为优化目标的集成调度模型.针对问题特性,通过设计改进的可能度计算方法,定义区间意义下解的Pareto占优关系.提出一种改进的离散鲸鱼群算法,通过同步调度与维护策略,实现制造与维护的联合优化;设计个体间距离计算策略,寻找“最近较优个体”;设计个体位置移动策略以及多邻域搜索策略,有效地平衡全局搜索和局部搜索,提高收敛精度.通过大量的仿真实验和结果对比分析,表明了所提出的算法对于求解区间数可重入
如何根据负载状况实时优化应用服务器集群的部署,以在能耗与性能之间取得平衡是急需解决的重要问题.对此,提出一种应用服务器集群能耗与性能平衡的在线实时优化策略,优化目标是最小化能耗与请求丢弃速率的加权值,优化内容包括各服务器的开关和CPU频率.该策略包括小规模集群优化(SSCOpt)和大规模集群优化(LSCOpt)两种方案:前者定义大量的变量,将集群优化描述成线性混合整数规划问题,然后采用软件包求解;后者通过分析能耗和负载模型的特性定义很少的变量,将集群优化描述成非线性混合整数规划问题,井提出一种基于花朵授粉
像素级图像融合方案多采用全局统一的融合规则,融合过程易导致区域层级信息丢失.对此,提出一种基于模糊区域特征(FRC)框架的红外与可见光图像融合方法.首先,制定一种模糊区域规则,该规则依据区域特征的模糊性质,对源图像依次施行区域分割、模糊判定和解模糊,全局图像的融合转化为3种不同属性区域的融合;然后,分别对目标区域、过渡区域和背景区域采用期望值最大(EM)、加权平均融合、主成分分析(PCA)的融合策
针对井联冷机负荷分配优化问题提出一种改进烟花算法,以井联冷机系统功耗最小为优化目标,以每台冷机的部分负荷率作为优化变量进行求解.在改进烟花算法中,首先针对基本烟花算法搜索初始解不均匀问题,提出基于混沌初始化的变量定义方法;然后针对高斯突变不利于跳出局部最优问题,采用变异范围更大的莱维飞行变异方法,提高了基本烟花算法的搜索能力;最后针对改进的烟花算法,以两个井联冷机系统测试案例对所提出的改进烟花算法性能进行测试,井与其他的优化算法的结果进行对比.实验表明,相比于其他算法,改进烟花算法可以得到较优的运行策略,
建立了熔融制样-X射线荧光光谱法(XRFS)测定火力发电厂烟气脱硫石膏中9种主次量元素(以元素氧化物形式表示)的方法,并用正交试验优化了熔融制样条件.将样品与四硼酸锂-偏硼酸锂混合熔剂(质量比12∶22)按1∶8的质量比混合,加入40g·L-1溴化锂溶液0.6 mL,在自动燃气熔样机上于1050℃熔融4.5 min,冷却脱模后即得玻璃样片,在优化的XRFS条件下测定.采用硫酸钙、氧化钙、石膏成分分析标准物质和煤灰成分分析标准物质配制的标准样品系列制作校准曲线,并用理论α系数法校正基体效应.结果 显示:9种
建立了熔融制样-X射线荧光光谱法(XRFS)测定含碳及碳化硅的铝镁质、锆质耐火材料中的二氧化锆、三氧化二铝、二氧化硅、氧化钙、氧化镁、三氧化二铁、二氧化钛等含量的方法.将样品置于950℃马弗炉内灼烧1h以除去其中的碳.将四硼酸锂置于铂-金坩埚中熔融,旋转坩埚使熔融态四硼酸锂附着在坩埚壁上,以减少碳化硅对铂-金坩埚的腐蚀.将1.0000 g碳酸锂、1.0000 g硝酸锂和0.3000 g灼烧过的样品混合,置于挂膜处理好的铂-金坩埚中,上面再覆盖2.0000 g四硼酸锂,在程序升温条件下预氧化以去除样品中的碳
舰载机甲板作业调度问题是一类具有NP-hard特性的资源受限多项目调度问题.首先,分析舰载机甲板作业调度问题的工序流程约束和各类资源约束,构建舰载机甲板作业调度混合整数规划模型.然后,基于基本引力搜索算法,提出双种群模糊引力搜索算法用于模型求解.算法采用基于作业时序修正的优先数编码,井采用双种群交替迭代结构,将基于个体的双向对齐技术扩展到种群层面,基于串行调度生成机制产生调度方案.为了提高算法性能,采用边界修正策略修正越界粒子编码,在引力计算阶段,采用模糊逻辑控制策略进行参数自适应控制.最后,通过案例仿真
建立熔融制样-X射线荧光光谱法(XRFS)同时测定硅酸盐岩和煤灰中13种主次量成分(二氧化硅、三氧化二铝、三氧化二铁、氧化钠、氧化钾、氧化钙、氧化镁、二氧化钛、五氧化二磷、氧化锰、氧化钡、五氧化二钒和三氧化硫等)的方法.将样品研磨、过筛、干燥,以质量比为1∶10的比例称取样品和混合熔剂(四硼酸锂和偏硼酸锂的质量比为67∶33),在700℃熔样炉中开炉门预氧化2 min,于1100℃熔融9 min,所得样片在优化的XRFS条件下测定.采用与样品基体接近的标准物质和标准样品制作校准曲线,并采用β系数法及可变理
车辆目标检测是智能交通系统中的重要环节,针对传统车辆目标检测方法效率低、小目标检测效果不好、漏检率高等问题,提出一种基于改进的YOLOv3网络车辆目标检测算法.为了提高车辆检测的效率,利用轻量化模型MobileNet v2代替原YOLOv3中的特征提取网络,使得网络计算量相比原算法有所降低.为了有效提高网络对小尺度车辆目标的检测能力,网络将由高到低不同尺度的特征层融合之后进行目标检测.为了得到更丰