【摘 要】
:
采用Sarsa(λ,k)学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数
【机 构】
:
广东东莞理工学院工业工程系,清华大学工业工程系,南佛罗里达大学工业与管理系统工程系
论文部分内容阅读
采用Sarsa(λ,k)学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数把调度问题转化为增强学习问题,并把Sarsa(λ,k)算法和梯度下降径向基神经网络函数泛化器结合使用。实验验证了Sarsa(λ,k)算法解决半导体测试调度问题的有效性。Sarsa(λ,k)算法通过反复解决调度问题来调整调度策略,能克服单个行为策略短视的缺点,综合利用各个行为策略的优点,从而找到较优的调度方案。
其他文献
党的指导思想是党具有生命力和创造力的根本所在.我们党的指导思想自党的七大确立以来,经历了两次重大调整,不断与时俱进.党的指导思想的每一次与时俱进都反映了客观现实的变
运用文献资料、问卷调查和专家访问法,对我国普通高校女教师的体育行为进行分析论证,揭示其存在的问题,并提出可行性对策和建议。旨在提高学校女教师身体素质,为全面推进"全民
支持向量机是由V.Vapnik等九十年代提出的一种学习技术,是借助于最优化方法解决机器学习问题的新工具。以统计学习理论为研究基础,研究内容分为分类和回归两个方面,并且在众多领
在提前期可控、订购成本可减且存在服务水平约束的条件下,研究了有顾客流失的买方成本最小化问题。将订购批量、单位订购成本、安全系数和提前期作为决策变量,分别在提前期需求
针对内燃机车中修解体组装作业往往采用以经验为主的生产管理方式这一瓶颈因素,通过AOA(Activity on Arc)网络建模框架下的工序分解、紧前分析和时间测度,将该复杂作业转化为符合
在对现有文献研究的基础上,从最基本的通用件库存模型出发,引入承诺交货期-价格因素,建立相应的通用件库存模型,研究承诺交货期与产品价格对通用件策略实施效果的影响。通过
协同物流模式涉及选择第三方物流企业招标、竞标以及第三方物流企业的利润分配等问题。以多代理系统为框架,定量研究了协同物流模式中的物流企业选择、招标、竞标以及利润分配
探讨了在仪器分析教学过程中开展多媒体课件辅助教学的优缺点,并提出了多媒体课件辅助教学与传统教学有机结合的解决方法。