论文部分内容阅读
数据的爆发式增长引发人们对数据的价值进行重新考量,在数据视角下人们产生了许多新的思路和想法,这种数据驱动的创新催发了大数据时代的思维变革。在交通领域,随着物联网技术的发展,传统依靠人力的交通数据采集正在向自动化、智能化的电子设备转变,并迅速积累了大量的交通数据。特别是各类车载诊断系统和导航设备收集了海量的机动车时空轨迹数据,这些时空轨迹大数据背后隐含着大量有价值的交通领域知识,是深入了解居民出行规律和活动模式,提高交通管理与服务水平,优化交通系统运行,解决城市各类交通问题的重要途径。但是现有的机动车时空轨迹挖掘研究多基于单一的出租车数据或少量私家车的样本数据,很难发现一些广泛的有价值的知识。对于路网上行驶的海量机动车,如何充分、快速、有效地挖掘其时空轨迹数据,从而发现广泛的、深层次的交通领域知识,是当前交通大数据研究的重要方面。本论文面向交通大数据服务领域,开展了基于海量浮动车时空轨迹数据、驾驶人信息、机动车属性信息、社交网络签到信息等的交叉探索研究。提出了基于时空轨迹信息的机动车驾驶人画像方法,并结合画像分析机动车驾驶人的出行规律和活动模式,联系机动车驾驶人的交通需求,进而帮助解决如何把数据库中复杂不可见的交通大数据转换成交通领域易于理解的知识和价值的问题;在机动车驾驶人驾驶特性画像中,本论文基于云模型对机动车驾驶人的驾驶行为模式进行分析,根据云运算原理,采用逆向云发生器,结合影响因素的模糊性、随机性以及统计特性对驾驶人驾驶行为的危险等级进行综合评价;另外,本论文针对当前阻碍新能源汽车产业发展的充电桩建设问题,提出了一种数据驱动的电动汽车充电桩推荐选址方法。该方法引入了“泊车地+兴趣区域+充电服务”的充电桩建设模式,通过对海量机动车时空轨迹数据和社交网络签到信息的融合计算得出充电桩建设的精准选址。在数据融合过程中,针对无监督机器学习算法DBSCAN算法无法区分不同对象特征进行聚类的问题,提出了一种改进的基于特征权重的W-DBSCAN聚类算法,新算法能够有效地根据对象特征区分出不同的簇。此外,在选址过程中还结合路网区域分割技术解决了大范围区域内数据点密度分布不均衡的问题。最后利用本选址方法以北京望京地区为例进行了案例分析。