论文部分内容阅读
国内3G于2009年正式上市,随后迅猛发展,目前中国已经成为全球最大的移动通信消费国。而随着智能手机和平板电脑等的普及,基于3G网络的移动应用业务需求也越发迫切,随之会带来大量全新的研究和各种社会应用,例如位置服务,物联网技术的结合以及移动社交网络数据挖掘等。随着SoLoMo概念的风靡,很多互联网企业已经将如何通过移动物联网与用户交互视为目前最大的需求,国内外创业公司都开始关注这个领域。在大多数这些技术和应用中,用户的移动行为起到关键性作用。比如个性广告推荐,基于内容的个性化搜索,流量预测等。针对目前对于挖掘国内移动用户的行为模式的需求,本文通过采集的海量国内3G网络流量,利用hadoop平台对采集的海量3G数据进行建模,通过深度包解析技术解析出流量的业务属性,并通过关联终端信息关联,分析不同终端用户的行为。基于此平台,通过基站数据研究用户的移动性行为,首先对基站数据进行预处理,结合地理位置信息对基站进行聚类,克服基站漂移问题。然后构造用户的分时段移动路径。通过并行化的FP-Growth算法挖掘出用户的频繁序列,并利用更量的FUFP算法进行快速更新。最后结合群体用户的业务规律预测用户的路径。本文的研究工作主要包括:首先搭建分布式平台解析海量3G网络数据,实现不同终端的匹配,从数据面和信令面角度研究3G网络,分析不同终端移动用户的行为。然后解析基站信息,结合地理位置信息和业务信息构造群体用户路径,利用并行化的关联数据挖掘算法挖掘用户的频繁模式,构建基于用户和基于区域两种规则进行预测。最后在预测用户的轨迹时不仅使用了用户的路径信息,同时结合了历史业务规律,提高了预测的准确度。