论文部分内容阅读
随着手机的普及,通过手机位置信息分析用户行为,以及特定地点的客流、客源分析等有着重要的意义,目前在各个行业也都有着广泛的应用。青海电信基于位置的分析主要是对旅游景点、展会、大型活动(青海湖环湖赛)等场景进行实时人流量分析、客源地分析、平均停留时间、游客停留天数以及产生的流量等进行分析并提供报告。目前分析报告的形成过程大多都是由人工完成的,随着各个行业分析报告的需求不断增加,手工提取数据进行计算统计的方法,无法提供更快更有效的支撑,已不能满足客户的需要,此外还存在单一的2G基站的位置定位不够准确的问题,急需建设一套融合多数据源的位置及自动化分析一体的系统,为更多的分析和应用提供标准化、持久化、实时数据分析的数据支撑,为更多的分析或报告提供系统化的支撑能力。本文主要通过数据挖掘技术融合主要包括2G、3G、4G基站以及DPI等移动位置更新数据,不同的数据源通过独立的应用程序进行流式处理后,将实时的位置数据实时更新到内存数据库Redis中,由于各种数据源接入的位置数据是不统一、不标准的,基于融合数据后的位置信息,都要使用统一经纬度的方式,最后将所有的区域以网格化的方式进行输出,应用系统通过网格化的数据进行统计分析及展现。将全省所有区域按照100*100平方米为单位划分为网格,并进行网格编号和位置标注。将提取的2G通话信令、2G信令位置、3G信令位置、4G信令位置及GPS等信息中的位置信息转换成网格化定义位置的网格编号,实现多数据源位置的网格化,形成标准位置数据。基于标准位置数据的实时分析及应用,可以对区域内用户流动情况及人员来源情况进行分析,基于用户行为的分析与其它用户行为分析结合,可以针对景区实现实时客流分析、游客来源地分析、用户属性分析、停留时间分析、首访景区分析、旅游线路分析、客流对比分析及客流预测分析等。系统实现的功能主要有:1、移动位置信息的提取过滤。根据用户上报的位置信息提取用户号码,IMSI,IMEI,匹配用户归属地市等信息。2、融合不同数据源。根据上报的时间以及数据优先级融合不同的数据。3、数据切片。每隔5分钟截取当前实时上报的数据,得到每隔5分钟的位置更新准实时历史数据,作为分析用户行为信息的基础数据,所有的后续分析结果均基于此数据。4、数据可视化。基站地图展示,可视化报告呈现。