论文部分内容阅读
随着民航的蓬勃发展,民航运营管理面临巨大的挑战。在机场运行中,停机位作为核心资源,其分配结果影响着机场运行效率。在现有研究中,停机位预分配方法得到了广泛的关注。但是,近年来随着航班数量的不断增加,停机位预分配方法已难以适应航班到达的不确定性。针对上述问题,本文对停机位动态分配方法进行研究,将停机位动态分配问题建模为马尔可夫决策过程,构建深度神经网络逼近停机分配策略,采用深度强化学习方法训练策略并进行性能测试,同时,设计并实现了基于深度强化学习的停机位分配演示系统。具体工作如下:(1)由于采用深度强化学习(DRL)解决停机位分配问题尚处于起步阶段,论文首先针对学术界应用较为广泛的停机位分配简化模型进行研究,探索基于DRL的停机位分配方法的可行性。根据停机位分配问题经典优化目标以及理想机场环境下的约束条件,进行优化问题建模。在此基础上,将机场停机位分配优化问题模型转化为马尔可夫决策过程,研究了基于策略梯度算法的DRL停机位分配策略网络训练方法。训练结果与优化软件Gurobi结果的对比显示论文提出方法在效果与优化软件持平的情况下,计算速度有明显提升,验证了DRL与停机位分配问题结合的可行性,并且证明了该方法适用于停机位动态分配。(2)研究考虑机场实际业务规则的停机位分配问题,并利用DRL算法求解。相比简化模型,考虑机场实际业务规则的停机位分配研究在以下几方面进行了扩展:第一,在停机位分配问题优化建模中,优化目标考虑了增加乘客数量权重的近机位分配率以及停机位分配失败率两个方面;第二,在优化问题转化为马尔可夫决策过程的研究中,由于优化目标的调整和实际业务规则约束条件的增加,状态空间的抽象建模更为复杂;第三,针对复杂的环境状态选取卷积神经网络作为策略网络进行停机位分配的智能决策。论文利用某机场实际数据,进行策略网络训练,将训练结果与传统算法进行比较,本文提出算法在效果上和计算速度上均有一定优势。(3)在算法研究的基础上,设计并实现了基于深度强化学习的停机位分配演示系统。论文首先分析了演示系统的设计目标和各类需求。在此基础上,对系统整体架构进行设计,将系统分为三层:数据访问层用于机场数据的存储;业务逻辑层用于进行机场停机位分配决策;表现层用于停机位分配算法的人机交互并将停机位分配结果向用户直观展示;论文阐述了每个层级的功能设计与实现方法。该系统可以直观地表现停机位分配结果以及其统计结果等,达到演示算法特点的效果。