基于强化学习的批处理机随机调度问题研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:endlessing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
批处理机是一类在满足约束的前提下可以同时处理多个工件的设备,目前已广泛应用于制造业中,例如金属加工、半导体生产、纺织品染整作业等相关领域。近年来,随着研究的深入,随机批调度问题也引起了众多学者的关注,本文主要研究差异工件随机到达情况下的单批处理机调度问题。首先依据系统物理模型和工作机制,建立了问题的数学模型,根据加工时间固定和随机两种情况将问题分别建模为半马尔科夫决策过程和连续时间马尔科夫决策过程。并利用基于数学模型的策略迭代算法求得最优调度策略,使系统的生产代价最小化。其次考虑到实际生产系统可能存在建模难和策略迭代算法求解时间过长的原因,引入了强化学习中的Q学习算法对问题进行求解。针对求解过程中Q学习出现的行动空间过大问题,提出了一种行动集删减策略,实验结果表明改进后的Q学习算法要比原始算法求解效果更好。然后针对规模较大的问题,提出了一种基于规则学习的调度方法,该方法在底层使用启发式规则调度工件,在上层使用Q学习为系统的每个状态选择合适的启发式规则。为此,根据系统特性设计了两类共九种启发式规则组成系统的规则库供Q学习搜索。仿真实验表明该方法相比于传统Q学习在优化能力和计算效率上有更好的性能,并且问题规模越大效果越明显。最后引入深度强化学习中的DQN算法对问题求解,探索采用神经网络代替人工对系统进行分析的可行性,以解决实际生产中规则学习调度方法可能存在启发式规则设计欠佳的情况。实验结果表明DQN算法能有效的进行自主学习,取得良好的求解效果。
其他文献
当下,我们面临的大众文化、社会语境等变化为当代艺术领域提供了很多思考的契机。而新语境下的中国画艺术创作问题,不得不让我们产生新的思考。今天,融合之所以突然受到关注
随着社会经济信息化程度提高和国民信息安全意识增强,以生物特征识别为技术基础的身份认证和识别受到越来越多地关注。借助深度学习技术的发展,新兴的指静脉识别技术以其高安
我国现行《商标法》给予“在先权利”与“在先未注册商标”的保护标准是不同的。但是在司法实践中,对二者予以保护的认定标准又存在相同的部分。这就导致判断有些在先商业标
全面从严治党,深入开展党风廉政建设和反腐败斗争,是党的十八大以来中国共产党治国理政最伟大的成就之一。2018年12月,中共中央政治局会议郑重宣告:"党内政治生态展现新气象,
随着人工智能的飞速发展,机器人同时定位与建图(SLAM)作为智能机器人领域的一个重要研究方向也得到了越来越多的关注。机器人同时定位与建图是机器人应用的核心技术,涉及领域
我国卫星图像识别技术在自然灾害、地表覆盖区域监测、环境资源分布研究等领域应用日趋广泛。卫星云雪图像中的云、雪等区域高光谱特征相似、空间分布特征复杂多变。传统的研
文本分类是自然语言处理中较为基础常见的任务,但由于词向量空间的单一性,使得分类系统不能在不同语言上通用。若分别对每种语言单独训练分类模型,则会导致大量的成本和时间问题;并且分类模型作为监督学习方法,需要大量的训练样本训练模型,而由于不同语言的资源分布不均,使得资源较少的语言无法构建单语言分类模型;另外,主流跨语言词嵌入模型需要依赖成本昂贵的平行语料库,在不同语种间拓展性差。因此,针对以上问题,本文
目前证券监管部门监管上市公司、大多数投资者了解上市公司主要通过信息披露平台这一工具。平台中的股权激励模块依靠信息公开,激发员工积极性,稳定核心专业人才。目前国内很
基于深度神经网络的算法在显著性目标检测方面取得了重大突破。然而,这些算法均受限于相当有限的输入分辨率(即,400×400甚至更低)。几乎没有研究致力于如何直接针对高分辨图
小农户占有资源少、生产成本高、融资能力弱,运用现代生产技术能力不强,难以与现代农业大生产、大物流、大市场的要求相适应,无法与现代农业发展有机衔接、获取经济效益困难