论文部分内容阅读
随着出租车行业的快速发展,出租车弥补了公共交通和私人交通的不足之处,成为了人们日常出行中必不可少的交通工具之一,在交通出行中起到了扮演了重要的角色。目前,北京市的交通状况正在逐步恶化,一方面,“打车难”成为交通出行的普遍现象;与之相对应的,有些时间段,很多出租车因为在路上载不到乘客而空载,出现“空车跑”的现象。这些空载的情况不仅会提高出租车司机的运营成本、减少收入,而且会给现有的交通状况带来额外的负担,同时还会加重环境污染和能源浪费的问题。基于以上的原因,如何有效的改善出租车与乘客之间的供需关系,达到供需平衡成为一个亟待解决的问题。近些年来,为了安全考虑和调度方便,很多大城市如上海、深圳、北京等都在出租车上装备了GPS定位设备。这些GPS定位设备会以一定的频率向出租车管理中心发送车辆的状态信息,包括所在的经纬度、时间以及载客状态等。这些数据不断积累,生成了大量的出租车GPS轨迹数据。出租车GPS轨迹数据包括了两方面的内容,一方面是出租车乘客的出行信息,例如乘客什么时候上车、下车,出行的出发地和目的地等,可以用来研究居民的日常出行行为;另一方面,出租车的行驶路线包括了出租车司机的习惯和行为,例如在哪些地方能够找到乘客、怎样的行驶的路线最近、油耗最少、时间最短等等,可以用来研究城市道路的最短路径和交通拥堵情况。通过对以上两方面的研究,本文通过挖掘大量的出租车GPS轨迹数据,提出了针对打车乘客的乘客候车点推荐模型和针对出租车司机的乘客订单推荐模型。具体包括两方面的内容:一方面,通过对大量的GPS轨迹数据的挖掘,发现出租车司机的日常行为特点,为正在打车的乘客推荐步行可以到达的最有可能遇到空载的出租车的地点,这些地点在文中称为出租车停靠点,向乘客推荐候车点,有效的减少了乘客的等车时间,缓解出租车和乘客之间的供需矛盾;另一方面,通过改进CKNN算法,根据正在寻找乘客的出租车司机的地理位置和当前的时间,为司机寻找最适合的乘客候选集,并提出两个影响出租车司机选择乘客行为的指标:乘客目的地的热门程度和司机偏好相关度,利用BP神经网络算法构建乘客推荐模型进行乘客订单筛选,为出租车司机推荐最佳的乘客集,从而有助于减少出租车的空载时间,提高司机的收益,同时也能达到减少油耗,降低污染的目的。本文的主要贡献如下:本文从出租车的GPS轨迹数据出发,通过聚类算法挖掘那些利润较高的出租车司机,并研究他们在非乘客高峰时间停车等待乘客的行为特点,根据这些出租车停靠点的特征,提出一种可以准确的挖掘出租车停靠点的候选轨迹点的算法,通过对候选轨迹点的过滤和聚类,得到了真正的出租车停靠点,从而构建了基于出租车候车点的乘客推荐模型,在有乘客发出打车需求时,实时检索乘客附近的出租车停靠点,该停靠点即为乘客最佳的候车点。本文改进了原有的CKNN算法,提出一种近似的CKNN算法来实时检索出租车附近的候选乘客集,通过对出租车GPS轨迹数据的挖掘,提出两个影响出租车司机选择乘客行为的指标:乘客目的地的热门程度、与司机的偏好相关度,可以通过挖掘出租车的热点载客区域计算乘客目的地的热门程度,通过挖掘出租车的历史行驶轨迹来计算司机的偏好相关度,最后利用BP神经网络算法构建乘客推荐模型,利用模型判定候选乘客集中每个乘客的推荐程度,为出租车司机推荐最佳的候选乘客集。