论文部分内容阅读
当前针对移动通信核心网数据的分析,大多是基于运营商语音业务数据等应用数据,而对于IP数据进行数据挖掘与分析的研究工作较少。伴随着移动通信网的快速发展以及IP化进程的深入,对于移动通信核心网中的IP数据进行分析是十分必要的。当前针对IP数据挖掘与分析的方法大部分是针对互联网,而针对移动通信核心网中这类数据的处理及用户行为分析等方面依然有待深入研究。本文针对上述情况,以移动通信核心网数据中的即时通信类数据为切入点,分析了该类型数据特征,并基于分析所得的数据特征建立了筛选模型以获得目标数据集。基于目标数据集,从节点的重要性、关联性以及节点相似性方面,对于该类通信用户进行行为分析。本文的主要贡献和创新点如下:1.构建了即时通信类数据筛选模型。通过分析基于XMPP协议类型的数据特征,建立了一致性筛选模型。该模型应用于hadoop平台的数据预处理模型筛选出目标分析数据集,为之后网络建立和数据分析提供统一的数据结构与格式。2.基于节点重要性分析的关键节点筛选。针对基于XMPP协议类型的即时通信数据,根据各节点间的连接关系生成可视化结果,并对于可视化结果中节点间的连接结构进行归类,使用PageRank算法计算了各节点的重要性,并在此基础上与归纳出的连接结构相结合,对于节点的重要性做进一步的分析以发掘关键用户节点。3.基于节点间关联性及相似性的用户潜在行为分析。在节点重要性分析的基础上,针对关键用户所在的网络结构提出了二部图简化模型,使用关联性及相似性算法对节点进行计算的同时,对于该节点在简化模型中对应节点也进行了关联性及相似性计算,同时结合两种计算结果对于节点关联性及相似性的变化趋向性进行分析。