【摘 要】
:
人群画像是对人们的日常行为规律等属性进行分析后形成的人群信息标签,能够为公共交通的调度优化和商业选址等提供数据支撑。但是目前人群画像的研究还存在两方面问题:一是通过使用海量公交数据研究人群画像,只能知道乘客常去的地点位置,无法解释其出行轨迹的特点;二是海量公交数据规模极大且包含许多人群聚集较少地区的信息,直接计算耗时大,而针对人群聚集较多的重点地区是研究的重点。为了解决上述问题,本文依托新加坡连续
论文部分内容阅读
人群画像是对人们的日常行为规律等属性进行分析后形成的人群信息标签,能够为公共交通的调度优化和商业选址等提供数据支撑。但是目前人群画像的研究还存在两方面问题:一是通过使用海量公交数据研究人群画像,只能知道乘客常去的地点位置,无法解释其出行轨迹的特点;二是海量公交数据规模极大且包含许多人群聚集较少地区的信息,直接计算耗时大,而针对人群聚集较多的重点地区是研究的重点。为了解决上述问题,本文依托新加坡连续一周共计约3000万条公交数据和4万条兴趣点(POI)数据做了如下工作:1)识别城市功能区。本文根据新加坡的兴趣点(POI)数据,将该数据重新划分为15类功能性并进行核密度分析,了解每种功能性的分布情况。然后将新加坡的地理区域按照1km×1km的区域进行划分,并根据每个区域内POI的分布情况,按照一天内不同的时间段识别每个区域的功能性;2)轨迹文本化。本文首先基于PageRank算法对重点地区的人群进行筛选,通过该方法提取出行次数多且去重点地区次数频繁的乘客轨迹数据。接着将筛选后的乘客轨迹数据按照年龄段与一周内连续的工作日与休息日进行划分后,将每位乘客的轨迹数据串联起来,形成了完整的轨迹数据集。然后通过将划分后的各个轨迹数据与城市功能区相融合,使每位乘客的轨迹以文本化的形式展现。最后对每位乘客的文本化轨迹使用TF-IDF(Term Frequency–Inverse Document Frequency)算法,从而得到每位乘客常去区域的功能性数据,即出行轨迹特点;3)刻画人群画像。本文将每位乘客常去区域的功能性数据使用多种聚类算法进行分类,通过与真实数据对比,将效果最好的聚类算法作为刻画人群画像的方法。通过将成年人和老年人的人群画像轨迹使用Flow Map进行可视化展示和描述,结果符合真实世界中人群的行为特征。结果表明:通过基于PageRank算法对重点地区的人群进行筛选,一共筛选出了300万条乘客轨迹数据,极大的减少数据量和提高数据处理效率;将轨迹数据与城市功能区相融合,形成文本化的轨迹,能够得到易解释的乘客出行特点;通过使用基于余弦距离的K-means算法,能够较好的刻画人群画像,其准确率接近80%。
其他文献
Himalensine A和B是2016年中科院上海药物研究所的岳建明院士课题组从虎皮楠植物西藏虎皮楠(D.himalense)的茎和叶中分离得到的两个新虎皮楠生物碱,分别属于 calyciphyllinesA 型和 daphnicyclidin 型。Himalensine B属三萜生物碱,具有6/5/7/5/6的五环稠合结构和八个手性中心,在合成上极具挑战性。初步的生物活性试验表明该生物碱对PT
激光与物质相互作用过程中会产生丰富的物理现象,比如阈上电离,高次谐波辐射和非次序双电离等。高次谐波辐射因为可以作为阿秒光源,并在超快探测中有重要的应用,近年来得到了人们的广泛关注。对谐波辐射的研究,在实验和理论上均已取得了重要的进展。一般高次谐波辐射谱可分为三个区域,即阈下区域,平台区域以及截止区域。先前人们主要关注平台以及截止区域谐波,因其可产生阿秒脉冲。近年来人们开始关注阈下区域谐波,其有望作
自从1960年光学激光发明以来,科学家们一直致力于实现波长更短的XUV和X射线激光。目前,最流行的X射线装置之一是基于加速器和波荡器的X射线自由电子激光(XFEL)。与XFEL原理不同,原子X射线激光以激发态离子或激发态原子为增益介质,利用合作自发辐射效应(放大自发辐射和超辐射等)实现无腔单程X射线放大。本文主要综述了原子X射线激光的基本进展,以及详细研究了相干XFEL泵浦下Ne原子X射线激光的合
运动目标识别是计算机视觉的一个基础理论,也是至关重要的一个分支,目标识别的结果直接影响后级图像处理的成功率。目标识别技术广泛应用于智能监控,军工航空,智慧医疗及人工智能等领域。随着人类的需求日益提高,图像信息量巨大,图像精确度高,图像处理系统的便捷性、可扩展性、可移植性、实时性和低延迟是当前迫切需要解决的问题。目前解决方案分为两类:一是从算法的本质入手,创新新算法或者优化已有算法,减少冗余、提高性
湖南省锑(Sb)矿资源丰富,水稻种植面积广,水田土壤中Sb元素含量及分布状况影响着粮食安全和区域环境。因此,本文以湖南省为研究区域,以水田土壤Sb元素为研究对象,采集了63个典型水田土壤剖面,共343个土壤样品,测定了样品总Sb含量。通过描述性统计、ANOVA分析对水耕表层Sb含量进行了对比分析;运用Arc GIS10.3分析了水耕表层样点Sb水平分布特征;对比分析了剖面各土层Sb含量、迁移富集特
盲道作为辅助视力障碍者出行的重要道路设施,由于自行车、汽车占道等原因,没有发挥其应有的作用。因此,对盲道进行识别具有重要的意义。盲道分割是盲道识别系统中的重要环节,现有的盲道分割算法存在分割率较差,处理方式单一等问题。随着深度学习技术的快速发展,研究出一种有效分割盲道图像方法具有重要的实用价值。本文在卷积神经网络的基础上,针对现有的盲道分割方法和网络结构存在的问题,结合注意力机制和多分支权重共享方
近些年来随着我国的城镇化、工业化的快速发展,生产建设活动越来越多。由于生产建设引起的水土流失问题也愈加严重。水土流失会带来很多问题,如:洪涝灾害、生态危机、居民饮水问题、粮食危机等。因此加强生产建设项目的监督和监管,对于解决环境问题有着重大的意义,是解决水土流失问题的当务之急。但是由于我国生产建设项目的数量多、扰动范围广、扰动周期长、需要进行现场监督检查的内容多,基于遥感影像的生产建设项目扰动图斑
随着在线社交网站空间规模的快速扩张,现实世界的社交网络很自然地就进入了动态网络领域。动态网络是一种特殊结构的演化复杂图,其中的变化随着时间的推移而频繁呈现,一方面会对网络的局部结构造成必然的影响,另一方面,一段时间内的动态演化可能导致整个社区结构的重大转变。识别动态社交网络的社区结构,不仅为开发有效的社区感知解决方案提供独到的见解,而且还有望实现广泛的应用程序,例如移动自组网(MANETs)中的路
合唱音色是表现作品情感、艺术形象和艺术风格时不可或缺的要素,音色调节是合唱训练的重要环节。统一的发声是调节合唱音色的基本要求;音量的合理分配直接影响到音色的表达;声部间的溶合需依据声部主次地位的不同而决定。本文从发声技巧、音量均衡和声部间溶合三方面入手,总结音色调节时的基本要求,以笔者毕业音乐会中三首作品为实例,探究每种手段在对应作品中的具体实施运用。
现代微电子封装系统中,由于电子封装层级繁杂、整体结构密集、涉及到的材料范围广泛,导致任何一个环节出现可靠性问题都有可能使得整个封装系统失效。无铅焊料互连焊点作为微电子封装系统中的二级封装连接材料,还具有如机械结构支撑、电气连接和热量耗散的重要作用,是能影响整个封装系统可靠性的重要因素。本文以Sn-Bi系合金为基础,通过研究Sn57BiAgCuCo、Sn45BiAgCuNi、64Sn-35Bi-1A