论文部分内容阅读
目前,日常生活中正在产生大量的时空轨迹数据。许多带有定位装置的出租车可以记录他们的位置并将其报告给服务器。大量的GPS数据生成了出租车轨迹,但是如何在推荐系统中应用这些轨迹成为了一个需要解决的问题。针对这一问题,最近已经出现了一些基于挖掘出租车轨迹移动性的寻客推荐系统。现有的系统侧重于推荐司机去乘客出现概率最大的地方寻客。但是他们大多忽略了在原地或者是附近等待可能会获得更大的利润。此外,推荐系统给出的建议很少考虑驾驶员之间的潜在竞争和实时交通路况对策略的影响。本文针对以上问题,提出了一个出租车寻客路线的可共享推荐系统。我们将原地或者就近停车等待客人也作为一种寻客的策略。将出租车司机的寻客过程用马尔科夫决策过程(Markov decision progress,MDP)来建模,并且提出一种全新的基于海量轨迹数据的Q-学习算法来进行模型的训练。考虑到对于同一位置的乘客,司机之间存在竞争,以及实时交通路况对寻客策略的影响,本文的系统在在线推荐过程中,利用驾驶员的反馈数据来对模型进行更新,并推荐当前最优的寻客策略。实验结果表明,我们的系统比目前的最先进的方法可以达到更好的性能。本文的主要贡献如下:·开发了一个出租车寻客路线的可共享推荐系统,该系统以最大化预期的利润为目标,向司机推荐一系列的寻客动作。我们使用了Q学习的方法高效的解决了这个最优化问题。本文是第一个将原地等客作为一种策略的寻客推荐系统。·在线推荐中,考虑到司机之间的潜在竞争和实时交通路况的影响,我们提出了基于加权轮询算法的策略推荐,从而避免推荐车辆进入交通堵塞的路段。·我们在实际的轨迹数据集上完成了模型的实验。实验结果显示,本文提出的方法比现有的其他算法可以获得更多的利润。