Qlearning相关论文
为提高单点控制交叉口时段内信号配时的准确性,采用强化学习方法构建时段内信号配时优化模型.该模型以时段内原始固定信号配时方案......
随着人们生活水平的不断提高,小龙虾不仅是风味小吃的一个新方向而且由于其体内含有大量虾青素也可以制作为药品来预防疾病。但是......
Q学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习方法,要用Q学习算法来求解有连续状态和决策空间的随机最优控制问题......
采用多层前馈遗传神经网络模型对甘蔗制糖结晶速度进行学习和预测,并针对该模型存在的计算量大,收敛慢的问题,采用具有强化作用的Q......