基于移动数据的出行模式识别方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:he110521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市化的不断发展,智能交通领域已经变得越来越火热,新技术的发展带来了一系列的新课题需要人们去研究。出行模式识别就是现阶段智能交通领域里的一个热门课题。出行模式识别对于运输研究人员,工程师和政府人员研究城市人口的行为以及规划,设计和管理运输系统来说至关重要。除此之外,出行模式识别在基于活动的建模中也发挥着重要作用。本文主要研究城市人口出行模式的识别,通过采集城市人口出行轨迹数据,对数据进行分析清洗,提取相关特征,利用机器学习与深度学习的相关算法来识别单个出行轨迹属于哪一类出行模式。本文使用的数据为移动数据,其中包括GPS轨迹数据和手机信令数据,除以上两种以外还借助了相关地理信息数据,包括基站位置数据与地铁站经纬度数据等。首先是移动数据分析与处理部分。本文使用了微软亚洲研究院开源的Geolife项目数据来进行研究。该项目数据形式为GPS轨迹数据,本文先将该数据中的label文件与GPS轨迹数据文件进行匹配,让每一段轨迹数据都有相对应的出行模式标签。对于原有数据的12类出行模式中不需要的一些模式进行剔除,最终保留六类出行模式的数据样本,一共获得3412个样本。然后对所有的数据样本提取了22个相关特征。除GPS轨迹数据之外,本文还使用手机信令数据进行相关实验研究。对于手机信令数据来说,其粒度粗,位置精确度低的特点导致该类型数据并不适用于对出行模式识别模型的直接训练,因此对手机信令数据实验部分采取迁移学习思想,利用之前GPS轨迹数据来训练模型,再将模型迁移至手机信令数据进行模型验证。其中,由于原始的手机信令数据缺乏数据标签的支撑,因此并不能直接用作相关实验。对此,本文利用长春市出租车轨迹数据,长春市公交车轨迹数据和长春市基站位置数据,基于一定规则将两类出行方式的轨迹数据转化为手机信令数据。采取迁移学习思想,利用GPS轨迹数据来训练模型和验证模型,再将训练好的模型迁移到手机信令数据,进行基于手机信令数据的模型验证。在经过处理之后的六类出行模式样本中,地铁出行模式具有与其他五种出行模式不同的特点。地铁出行模式的起点与终点具有明显趋近与地铁站附近的特点。由于大多数地铁线路都在地下运行,导致信号丢失严重。再加上地铁列车属于封闭的金属体,GPS信号也可能不完整。这就导致在地铁旅行期间不存在任何GPS点或仅存在少量GPS点记录。这些特殊的特征使得对于地铁出行模式的识别应该与其他交通方式的出行模式识别不同。因此,针对地铁出行模式,本文采用基于行程段的起点与某个地铁站之间的距离小于临界距离和行程段的终点与某个地铁站之间的距离小于临界距离这两条规则来对地铁出行模式进行识别。最终结果的识别准确率为0.828897。对于出行模式六类样本的整体分类问题,实验的数据样本具有数据质量高,样本数量可观,样本区分度明显的特点。因此,本文还使用基于深度学习的深度因子分解机算法,利用之前提取的相关特征,来对GPS轨迹数据的六类出行模式进行分类研究。对于转化后的手机信令数据提取与GPS轨迹数据相同的特征,再利用训练好的模型对手机信令数据样本进行模型验证。最终对于GPS数据,总体准确率达到了0.6735,结果要优于多层感知机模型。最后,本文使用基于机器学习的随机森林模型,Light GBM模型,采取与深度因子分解机模型的相同的处理程序,对基于移动数据的出行模式识别方法进行相关研究。对于GPS数据,Light GBM模型的准确率达到了0.90776,随机森林模型的准确率达到了0.855051,实验结果要明显优于支持向量机模型的实验结果。对于手机信令数据也进行相关实验及实验结果对比。
其他文献
从山东、河南、河北、北京、江苏、广东、广西、四川、吉林、辽宁、台湾11省42个不同鸡群收集临床有发病表现的828只病、死鸡的病理组织样品,用点杂交方法检测各个样品中马立
借鉴胜任特征的理论,分析高校体育教师的胜任能力结构,运用因素分析,构建高校教师胜任能力模型,结果表明:探索性因素分析确定高校教师胜任能力包含体育教学能力、体育教育能
乌兹别克斯坦,一个历史悠久的国家。虽然与我国不直接接壤,但乌兹别克斯坦却是我国的友好邻邦之一。早在2000多年以前,“丝绸之路”就把这块土地同东、西方文明的中心连接起来。
在一些零件的加工中,热处理是一个单独的工序,特别对于大直径的棒料来说,零件加工完成之后,直径非常大,热处理的实现非常困难,本文研究分析大直径材料的热处理深度,通过在线
在发动机运转过程中,排气歧管温度会产生周期变化,会导致排气歧管发生低周疲劳破坏,文章基于ABAQUS对某发动机的排气歧管进行低周疲劳分析,研究排气歧管的低周疲劳寿命。
论文基于GB1589-2016 的实施,分析国外货车列车应用现状,探讨探讨国内货车列车近期的发展趋势,从运营效率提升的角度探讨运营组织模式的可行的变化趋势,从而为国内货车列车底
目的调查医院Ⅰ类切口手术围手术期抗菌药物应用情况。方法抽取2011年Ⅰ类切口手术病历共164份,对抗菌药物的应用情况进行回顾性分析。结果Ⅰ类切口手术预防性用药率为26.83%
将.Au70Pt30合金废料用王水溶解处理成溶液后,通过对金的几种还原试剂进行了探索,从中找到了一种既能还原Au,又对溶液中Pt的直接提纯无影响的试剂B,实现了Au与Pt的分离和Au的
本文研究求解无约束非凸问题的BFGS方法以及求解非线性约束问题的序列二次规划(SQP)方法,既约Hessian SQP方法,序列二次约束二次规划(SQCQP)方法.我们首先在第1章简单介绍将要研
<正>目的调研近三年来个体化药学服务在医院药学部门的开展情况。方法选取2013年重点专科评审的89家医院作为研究对象,收集被调查医院2010-2012年期间个体化药学服务开展的品
会议