论文部分内容阅读
常规公交是城市公共交通的重要组成部分,但阴雨天气等因素导致车辆GPS数据不完整,会影响公交IC卡乘客上下车站点识别,因此需要进行缺失公交到站数据修补。大部分城市公交IC卡乘客仅上车刷卡,因此需要识别乘客下车站点。轨道开通前,沿线待调整公交线路需要确定。针对以上问题,基于多源数据挖掘,本文的主要工作如下:(1)提出一种基于多源数据和DBSCAN算法的缺失公交到站数据修补方法。该方法使用多源数据关联分析补全缺失到站名称、经纬度,并使用DBSCAN算法聚类后的相似班次数据推算缺失到站时刻。理论分析表明,该方法改善现有方法准确度低和普适性差的缺点。厦门市实例结果表明:该方法可正确修补全部缺失到站名称、经纬度,并且在到站时刻修补的准确度和普适性方面均优于基于GPS数据聚类方法和极大概率估计方法。(2)提出一种基于两层Stacking框架的出行链断裂时公交IC卡乘客下车站点识别方法。该方法第一层使用五种方法:基于个人高频站点的方法、基于下游站点吸引权的方法、基于换乘便利性概率的方法、基于用地性质吸引概率的方法和基于群体历史记录方法;第二层使用Logistic回归模型,确定不同数据集中第一层各方法的合适权重,提升整体泛化能力。理论分析表明,该方法可改善现有方法下车站点识别率低和准确率低的缺点。厦门市实例结果表明:所提基于两层Stacking框架方法的识别率高于基于乘客高频站点和下游站点吸引权方法,准确率优于基于KNN方法、基于决策树方法、基于随机森林方法和基于乘客高频站点和下游站点吸引权方法。(3)提出一种基于公交IC卡数据的轨道交通沿线待调整常规公交线路选择方法。该方法可在轨道开通前同时考虑公交和轨道影响构建指标,建立并求解超效率DEA模型,确定每条线路效率值和待调整顺序。理论分析表明,该方法可以改善现有方法缺少结合公交和轨道影响且无法确定线路待调整顺序的缺点来提升正确率。厦门市实例结果表明:已知待调整公交线路数量时,该方法选择待调整线路的正确率高,且对不同线路弹性研究和确定待调整顺序方面,优于基于公交共线线路长度方法和基于广义出行时间成本与出行时间节省比例模型方法。