论文部分内容阅读
随着公交IC卡的应用和普及,从IC卡数据中挖掘通勤用户,为下阶段采取分流措施缓解早晚高峰压力,优化票价制定等具有重要意义。以广州市地铁数据为依托,选取合适的特征属性,提出了一种基于梯度提升树(gradient boosting decision tree,GBDT)机器学习算法为基础的通勤人群识别方法。首先以周工作日的首末次平均刷卡时间、首末次平均刷卡时长、首末次刷卡时长波动程度、刷卡次数总和等5个特征来制定调查问卷的数据格式。然后利用处理过的带标签(通勤/非通勤)的调查问卷数据去训练GBDT分类器模型,